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Polypeptides implioues dans la biosynthese pes spiramycines, sequences 

" NUCLEQTIDIOUES CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS 



La presente invention conceme Tisolement et Identification de nouveaux genes de 
la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans 
cette biosynthese. Elle est egalement relative a Tutilisation de ces genes dans le but 
d'augmenter les taux de production et la purete de la spiramycine produite. 

L'invention a egalement trait a l'utilisation de ces genes pour la construction de 
mutants pouvant conduire a la synthese de nouveaux antibiotiques ou a des formes 
derivees de spiramycines. L' invention concerne encore les molecules produites grace a 
l'expression de ces genes et enfin des compositions pharmacologiquement actives d'une 
molecule produite grace a P expression de tels genes. 

Les Streptomyces sont des bacteries filamenteuses Gram positif du sol. Elles 
jouent un role important dans la decomposition et la mineralisation des matieres 
organiques grace a la grande diversite des enzymes degradatives qu'elles secretent Elles 
presentent des phenomenes de differenciations morphologiques uniques chez les 
procaryotes s'accompagnant d r une differenciation metabolique caracterisee par la 
production de metabolites secondaires presentant une extraordinaire diversite de 
structures chimiques et d'activites biologiques. Parmi ces metabolites, on retrouve les 
spiramycines produites a 1'etat naturel par la bacterie Streptomyces ambofaciem. 

La spiramycine est un antibiotique de la famille des macrolides utile aussi bien en 
medecine veterinaire qu'en medecine humaine. Les macrolides sont caracterises par la 
presence d'un cycle lactone sur lequel sont greffes un ou piusieurs sucres. Streptomyces 
ambofaciens produit a 1'etat naturel la spiramycine I ? II et III (cf. Figure 1), cependant 
Tactivite antibiotique de la spiramycine I est nettement superieure a celle des 
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spiramycines II et III (Liu et aL, 1999). La molecule de spiramycine I est constitute d'un 
macro-cycle lactonique, appelle platenolide et de trois sucres : la forosamine, le 
mycaminose et le mycarose (cf. Figure 1). L'activite antibiotique des spiramycines est 
due a une inhibition de la synthese proteique chez les procaryotes par un mecanisme 
impliquant la liaison de T antibiotique au ribosome bacterien. 

Certains composes membres de la famille des macrolides et possedant egalement 
un cycle lactone ont donne lieu a des utilisations hors du domaine des antibiotiques. 
Ainsi le produit FK506 a des effets immunosuppresseurs et offre des perspectives 
d'application therapeutique dans le domaine de la transplantation d'organe, de Parthrite 
rhumatoide et plus generalement dans des pathologies liees a des reactions 
autoimmunes. D'autres macrolides comme ravermectine ont des activites insecticides et 
anti-helminthiques. . , 

De nombreuses voies de biosynthese, concernant des antibiotiques appartenant : a 
des classes varices ainsi que d'autres metabolites secondaires (pour une revue, Chater K. 
1990), ont a ce jour deja ete etudiees chez les Streptomycetes. Cependant, la 
connaissance des voies de biosynthese des spiramycines n'est que tres parti elle a ce jour. 

La biosynthese des spiramycines est un processus complexe comportant de 
nombreuses etapes et impliquant de nombreuses enzymes (Omura et aL, 1979a, Omura 
et aL, 1979b). Les spiramycines appartiennent a la large classe des polyketides qui 
regroupe des molecules complexes parti culierement abondantes dans les 
microorganismes du sol. Ces molecules sont regroupees non pas par analogic de 
structure mais par une certaine similarite au niveau d'etapes de leur voie de biosynthese. 
En effet, les polyketides sont produits par une serie complexe de reactions mais 
possedent en commun d'avoir dans leur voie de biosynthese une serie de reactions 
catalysees par une ou des enzymes appelees « polyketides synthases » (PKS). Chez 
Streptomyces ambofaciens, la biosynthese du macro-cycle lactonique des spiramycines 
(platenolide) est realisee par une serie de huit modules codes par cinq genes PKS 
differents (Kuhstoss S., 1996, brevet US 5,945,320). Les spiramycines sont obtenues a 
partir de ce cycle lactone. Cependant, les diverses etapes et enzymes impliquees dans la 
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synthese des sucres, ainsi que leur liaison au cycle lactone et la modification de ce cycle 
pour 1'obtention des spiramycines restent encore inconnues a ce jour. 

" _ Le~brevet ~U S ~5~5T4~5T4~~&€cnt Te "clraage" d T ra^ s^q^ence" appelee srmRdnQz 
Streptomyces ambofaciens. II est fait 1'hypothese dans ce brevet que le gene srmR code 
une proteine regulatrice de la transcription des genes impliques dans la biosynthese des 
macrolides. 

En 1987, Richardson et collaborateurs (Richardson et al., 1987) ont montre que la 
resistance a la spiramycine de S. ambofaciens est conferee par au moins trois genes, ces 
derniers ont ete appeles srmA, srmB et srmC. Le brevet US 4,886,757 decrit plus 
particulierement la caracterisation d'un fragment d'ADN de S. ambofaciens contenant le 
gene srmC. Cependant la sequence de ce gene n'a pas ete divulguee. En 1990, 
Richardson et collaborateurs (Richardson et al, 1990) ont pose 1'hypothese de 
1 'existence de trois genes de biosynthese de la spiramycine proche de srmB. Le brevet 
US 5,098,837 rapporte le clonage de cinq genes potentiellement impliques dans la 
biosynthese de la spiramycine. Ces genes ont ete baptises srmD. srmE, srmF, srmG et 
srmH. 

Une des difficulty majeures dans la production de composes tels que les 
spiramycines reside dans le fait que de tres grands volumes de fermentation sont 
necessaires k la production d'une quantite relativement faible de produit. II est done 
souhaitable de pouvoir augmenter l'efficacite de production de telles molecules afin 
d'en diminuer les couts de production. 

La voie de biosynthese des spiramycines est un processus complexe et il serait 
souhaitable d'identifier et de supprimer les reactions parasites qui pourraient exister au 
cours de ce processus. Le but d'une telle manipulation est d'obtenir un antibiotique plus 
pur et/ou une amelioration de la productivity A ce sujet, Streptomyces ambofaciens 
produit a I'etat naturel la spiramycine I, II et III (cf. Figure 1), cependant l'activite 
antibiotique de la spiramycine I est nettement superieure a celle des spiramycines II et 
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III (Liu et aL, 1999). II serait done souhaitable de pouvoir disposer de souches ne 
produisant que de la spiramycine I. 

En raison de l'interet commercial des antibiotiques macrolides, l'obtention de 
nouveaux derives, notamment d f analogues de spiramycines ayant des proprietes 
avantageuses est intensivement recherchee. II serait souhaitable de pouvoir generer en 
quantite suffisante les intermediates de biosynthese de la voie de biosynthese des 
spiramycines ou des derives des spiramycines notamment dans le but de fabriquer des 
antibiotiques hybrides derives des spiramycines. 

Description generate de Tinvention 

La presente invention resulte du clonage de genes dont le produit intervient dans la 
biosynthese des spiramycines. L'invention concerne tout d'abord de nouveaux genes de 
la voie de biosynthese des spiramycines et de nouveaux polypeptides impliques dans 
cette biosynthese. 

Les genes de la voie de biosynthese et les sequences codantes associees ont ete : 
clones et la sequence d'ADN de chacun a ete determinee. Les sequences codantes 
clonees seront designees par la suite orfl*c, orf2*c, or/3*c, orf4*c, orf5* or/6* f orf7*c, 
orf8* or/9* orflO* orfl, orJ2 f orfi, orf4 } orf5, orf6, or/7, orfS, orflc, orflO, orfllc, • 
orfl2 } or/13c, orfl4, orfl5c, orfl6, orfl7 t or/18, or/19, orf20, orfllc, orf22c t orf23c } 
orf24c et or/25c. La fonction des proteines codees par ces sequences dans la voie de 
biosynthese des spiramycines est developpee dans la discussion ci-apres qui est illustree 
par les figures 4, 5 ? 6 et 8. 

1) Un premier objet de l'invention concerne un polynucleotide codant un 
polypeptide implique dans la biosynthese des spiramycines caracterise en ce que la 
sequence dudit polynucleotide est : 
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(a) l'une des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 
30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 

(b) l'une des sequences constitutes par les variants des sequences (a), 

(c) Tune des sequences derivees des sequences (a) et (b) en raison de la 
degenerescence du code genetique. 

2) La presente invention a egalement pour objet un polynucleotide s'hybridant 
dans des conditions d'hybridation de forte stringence a au moins Tun des 
polynucleotides selon le paragraphe 1) ci-dessus. 

3) L'invention concerne egalement un polynucleotide presentant au moins 70%, 
80%, 85%, 90%, 95% ou 98% d'identite en nucleotides avec un polynucleotide 
comprenant au moins 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 
250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 
1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 
1800, 1850 ou 1900 nucleotides consecutifs d'un polynucleotide selon le paragraphe 1) 
ci dessus. 

4) L'invention concerne egalement un polynucleotide selon le pragraphe 2) ou 3) 
ci-dessus caracterise en ce qu'il est isole a partir d'une bacterie du genre Streptomyces . 

5) L'invention concerne egalement un polynucleotide selon le pragraphe 2), 3) ou 
4) ci-dessus caracterise en ce qu'il code une proteine impliquee dans la biosynthese 
d'un macrolide. 

6) L'invention concerne egalement un polynucleotide selon le pragraphe 2), 3) ou 
4) ci-dessus caracterise en ce qu'il code une proteine ayant une activite similaire a la 
proteine codee par le polynucleotide avec lequel il s'hybride ou il presente 1'identite. 

7) L'invention concerne egalement un polypeptide resultant de 1'expression d'un 
polynucleotide selon le pragraphe 1), 2), 3), 4), 5) ou 6) ci-dessus. 
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8) Un autre aspect de invention concerne un polypeptide implique dans la 
biosynthese des spiramycines caracterisee en ce que la sequence dudit polypeptide est : 

(a) l'une des sequences SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 
29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 

5 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83 et 85, 

(b) l'une des sequences telles que definies en (a) excepte que tout au long de 
ladite sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes sans 
en affecter les proprietes fonctionnelles, 

(c) Tune des sequences constitutes par les variants des sequences (a) et (b). 

10 9) Un autre objet de P invention concerne un polypeptide presentant au moins 

70%, 80%, 85%, 90%, 95% ou 98% d'identite en acides amines avec un polypeptide 
comprenant au moins 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 
200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520? 
540, 560, 580, 600, 620 ou 640 acides amines consecutifs d'un polypeptide selon le* 

15 paragraphe 8) ci-dessus. 

10) Un autre aspect de 1' invention concerne un polypeptide selon le paragraphe 9) 
ci-dessus caracterise en ce qu'il est isole a partir d'une bacterie du genre Streptomyces. 

1 1) Un autre aspect de V invention concerne un polypeptide selon le paragraphe 9) 
ou 10) ci-dessus caracterise en ce qu'il code une proteine impliquee dans la biosynthese 

20 d'unmacrolide. 

12) Un autre aspect de 1' invention concerne un polypeptide selon le pragraphe 9), 
10) ou 11) ci-dessus caracterise en ce qu'il a une activite similaire a celle du 
polypeptide avec lequel il partage l'identite. 

13) Un autre aspect de Tinvention concerne un ADN recombinant caracterise en 
25 ce qu'il comprend au moins un polynucleotide selon Tun des paragraphes 1), 2), 3), 4), 

5) ou 6) ci-dessus. 
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14) Un autre aspect de 1' invention concerne un ADN recombinant selon le 
pragraphe 13) ci-dessus caracterise en ce que le dit ADN recombinant est compris dans 
un vecteur. 

15) Un autre aspect de 1'invention concerne un ADN recombinant selon le 
paragraphe 14) ci-dessus caracterise en ce que ledit vecteur est choisi parmi les 
bacteriophages, les plasmides, les phagemides, les vecteurs integratifs, les fosmides, les 
cosmides, les vecteurs navettes, les BAC ou les PAC. 

16) Un autre aspect de F invention concerne un ADN recombinant selon le 
pragraphe 15) ci-dessus caracterise en ce que ledit vecteur est choisi parmi pOS49.1, 
pOS49.1 1, pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4^ 
pSPM5 5 pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, 
pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, 
pSPM504, pSPMS07, pSPM508, pSPM509, pSPMl 5 pBXLllll, P BXL1112 et 
pBXL1113. 

17) Un autre aspect de Finvention concerne un vecteur d' expression caracterise en 
ce qu'il comprend au moins une sequence d'acide nucleique codant un polypeptide 
selon le pragraphe 7), 8), 9), 10), 1 1) ou 12) ci-dessus. 

18) L'invention est egalement relative a un systeme d' expression comprenant un 
vecteur d 5 expression approprie et une cellule hote permettant F expression d'un ou 
plusieurs polypeptides selon le paragraphe 7), 8), 9), 10), 1 1) ou 12) ci-dessus. 

19) L'invention est egalement relative a un systeme d'expression selon le , 
paragraphe 18 ci-dessus caracterise en ce qu'il est choisi parmi les systemes 
d'expression procaryotes ou les systemes d'expression eucaryotes. 

20) L'invention est egalement relative a un s}'steme d'expression selon le 
paragraphe 19) ci-dessus caracterise en ce qu'il est choisi parmi les systemes 
d'expression chez la bacterie E, coli, les sytemes d'expression baculovirus permettant 
une expression dans des cellules d'insectes, les sytemes d'expression permettant une 
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expression dans des cellules de levures, les sytemes depression perrnettant une 
expression dans des cellules de mammiferes. 

21) L 5 invention est egalement relative a une cellule hote dans laquelle a ete 
introduit au moins un polynucleotide et/ou au moins un ADN recombinant et/ou au 
moins un vecteur ^expression selon Tun des pragraphes 1) 3 2), 3), 4), 5), 6), 13), 14), 
15), 16) ou 17) ci-dessus. 

22) L'invention est egalement relative a un procede de production d'un 
polypeptide selon le paragraphe 7% 8), 9), 10), 11) ou 12) ci-dessus caracterise en ce 
que ledit procede comprend les etapes suivantes: 

a) inserer au moins un acide nucleique codant ledit polypeptide dans un vecteur 
approprie ; 

b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transform ee ou transfectee avec le vecteur de l'etape a) ; 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Fextrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit 

23) Un autre aspect de l'invention concerne un microorganisme bloque dans une 
etape de la voie de biosynthese d'au moins un macrolide. 

24) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23) ci-dessus caracterise en ce qu'il est obtenu en inactivant la fonction d'au 
moins une proteine impliquee dans la biosynthese de ce ou de ces macrolides dans un 
microorganisme producteur de ce ou de ces macrolide. 

25) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 24) ci-dessus caracterise en ce que Pinactivation de cette ou de ces proteines 
est effectuee par mutagen ese dans le ou les genes codant ladite ou lesdites proteines ou 
par expression d'un ou de plusieurs ARN anti-sens complementaires de TARN ou des 
ARN messagers codant ladite ou lesdites proteines. 
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26) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 25) ci-dessus caracterise en ce que I'inactivation de cette ou de ces proteines 
. CSt cffecUl6e P ar mutagenese par irradiation, par action d'agent chimique mutagene, par 
mutagenese dirigee ou par remplacement de gene. 

5 27) Un autre aspect de l'invention concerne un microorganisme selon le 

paragraphe 25) ou 26) ci-dessus caracterise en ce que la ou les mutageneses sont 
effectuees in vitro ou in situ, par suppression, substitution, deletion et/ou addition d'une 
ou plusieurs bases dans le ou les genes considers ou par inactivation genique. 

28) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23), 24), 25), 26) ou 27) ci-dessus caracterise en ce que ledit 
microorganisme est une bacterie du genre Streptomyces. 

29) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27) ou 28) ci-dessus caracterise en ce que le macrolide est 
la spiramycine. 

30) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27), 28) ou 29) ci-dessus caracterise en ce que ledit 
microorganisme est une souche de S. ambofaciens. 

31) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 23), 24), 25), 26), 27), 28), 29) ou 30) ci-dessus caracterise en ce que la 
mutagenese est effectuee dans au moins un gene comprenant une sequence selon Pun 
des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus. 

32) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 25), 26), 27), 28), 29), 30) ou 31) ci-dessus caracterise en ce que la 
mutagenese est effectuee dans un ou plusieurs genes comprenant une des sequences 
correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, H, 13, 15 17 
19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74 76 
78, 80, 82 ei 84. 
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33) Un autre aspect de 1'invention concerne un microorganisme selon le 
paragraphe 25), 26), 27), 28), 29), 30), 31) ou 32) ci-dessus caracterise en ce que la 
mutagenese consiste en Pinactivation genique d'un gene comprenant une sequence 
correspondant a la sequence SEQ ID N° 13. 

34) Un autre aspect de rinvention concerne une souche de Streptomyces 
ambofaciens caracterisee en ce qu'il s'agit d'une souche choisie parmi Tune des 
souches deposees aupres de la Collection Nationale de Cultures de Microorganismes 
(CNCM) le 10 juillet 2002 sous le numero d'enregistrement 1-2909, 1-2911, 1-2912, I- 
2913, 1-2914, 1-2915, 1-2916 ou 1-2917. 

35) Un autre aspect de rinvention concerne un procede de preparation d f un 
intermediaire de biosynthese de macrolide caracterise en ce qu'il comprend les etapes 
suivantes : 

a) cultiver, dans un milieu de culture approprie, un microorganisme selon Tun des 
paragraphs 22), 23), 24), 25), 26), 27), 28), 29), 30), 3 1 ), 32), 33) ou 34) ci dessus, 

b) recuperer le milieu de culture condition^ ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de 1 'extrait 
cellulaire obtenu a Petape b), ledit intermediaire de biosynthese. 

36) Un autre aspect de Finvention concerne un procede de preparation d'une 
molecule derivee d'un macrolide caracterise en ce que Ton prepare un intermediaire de 
biosynthese selon le procede du paragraphe 35) ci-dessus et que l'on modifie 
P intermediaire ainsi produit. 

37) Un autre aspect de l'invention concerne un procede de preparation selon. le 
paragraphe 36) ci-dessus caracterise en ce que Ton modifie ledit intermediaire par voie 
chimique, biochimique, enzymatique et/ou microbiologique. 

38) Un autre aspect de l'invention concerne un procede de preparation selon le 
paragraphe 36) ou 37) ci-dessus caracterise en ce que Ton introduit dans ledit 
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microorganisme un ou plusieurs genes codant des proteines susceptibles de modifier 
1'intermediaire en s'en servant comme substrat. 



" ~ 39) Un autre aspect "de Pinvention conecme un precede de preparation ^selon le 
paragraphe 36), 37) ou 38) ci-dessus caracterise en ce que le macrolide est la 
5 spiramycine. 

40) Un autre aspect de Pinvention concerne un precede de preparation selon le 
paragraphe 36), 37), 38) ou 39) ci-dessus caracterise en ce que le microorganisme 
utilise est une souche de S. ambofaciens. 

41) Un autre aspect de Pinvention concerne un microorganisme produisant de la 
1 0 spiramycine I mais ne produisant pas de spiramycine II et III 

42) Un autre aspect de 1'invention concerne un microorganisme selon le 
paragraphe 41) ci-dessus caracterise en ce qu'il comprend Pensemble des genes 
necessaires a la biosynthese de la spiramycine I mais que le gene comprenant la 
sequence SEQ ID N° 13 ou Pun de ses variants ou Tune des sequences derivees de 

5 celles-ci en raison de la degenerescence du code genetique et codant un polypeptide de 
sequence SEQ ID N° 14 ou Pun de ses variants n'est pas exprime ou a ete rendu inactif. 

43) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 42) ci-dessus caracterise en ce que la dite inactivation est realisee par 
mutagenese dans le gene codant ladite proteine ou par Pexpression d'un ARN anti-sens 

) complementaire de PARN messager codant ladite proteine. 

44) Un autre aspect de Pinvention concerne un microorganisme selon le 
paragraphe 43) ci-dessus caracterise en ce que la dite mutagenese est effectuee dans le 
promoteur de ce gene, dans la sequence codante ou dans une sequence non codante de 
maniere a rendre inactive la proteine codee ou a en empecher son expression ou sa 
traduction. 
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45) Un autre aspect de ^invention concerne un microorganism e selon la 
revendication 43) on 44) ci-dessus caracterise en ce que la mutagenese est effectuee par 
irradiation, par action d' agent chimique mutagene, par mutagenese dirigee ou par 
remplacement de gene. 

46) Un autre aspect de Finvention concerne un microorganisme selon le 
paragraphe 43), 44) ou 45) ci-dessus caracterise en ce que la mutagenese est effectuee in 
vitro ou in situ, par suppression, substitution, deletion et/ou addition d f une ou plusieurs 
bases dans le gene considere ou par inactivation genique. 

47) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 41) ou 42) ci-dessus caracterise en ce que ledit microorganisme est obtenu 
en exprimant les genes de la voie de biosynthese de la spiramycine sans que ceux-ci ne 
comprennent le gene cpmprenant la sequence correspondant a SEQ ID N° 13 ou Pun de 
ses variants ou Tune des sequences derivees de celles-ci en raison de la degenerescence 
du code genetique et codant un polypeptide de sequence SEQ ID N° 14 ou Tun de.ses 
variants. 

48) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46) ou 47) ci-dessus caracterise en ce que ledit 
microorganisme est une bacterie du genre Streptomyces. 

49) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47) ou 48) ci-dessus caracterise en ce que ledit 
microorganisme est obtenu a partir d'une souche de depart produisant les spiramycines 
I, II et III. 

50) Un autre aspect de l'invention concerne un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47), 48) ou 49) ci-dessus caracterise en ce qu'il 
est obtenu par mutagenese dans un gene comprenant la sequence correspondant a SEQ 
ID N° 13 ou Tun de ses variants ou 1'une des sequences derivees de celles-ci en raisori 
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de la degenerescence du code genetique et codant un polypeptide de sequence SEQ ID 
N° 14 ou l'un de ses variants ayant la meme fonction. 

"51) Un autre" aspect de 1 'invention concerne" un microorganisme selon le 
paragraphe 41), 42), 43), 44), 45), 46), 47), 48), 49) ou 50) ci-dessus caracterise en ce 
que ledit microorganisme est obtenu a partir d'une souche de S. ambofaciens produisant 
les spiramycins I, II et III, dans laquelle est effectuee une inactivation genique du gene 
comprenant la sequences correspondant a SEQ ID N° 13 ou 1'une des sequences 
derivees de celle-ci en raison de la degenerescence du code genetique. 

52) Un autre aspect de 1'invention concerne une souche de S. ambofaciens 
caracterisee en ce qu'il s'agit de la souche deposee aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) le 10 juillet 2002 sous le numero 
d'enregistrement 1-2910. 

53) Un autre aspect de 1'invention concerne un precede de production de 
spiramycine I, caracterise en ce qu'il comprend les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon l'un 
desparagraphes 41), 42), 43), 44), 45), 46), 47), 48), 49), 50), 51) ou 52) ci-dessus, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
1'extrait cellulaire obtenu a l'etape b), la spiramycine I. 

54) Un autre aspect de 1'invention concerne l'utilisation d'un polynucleotide 
selon l'un des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus pour ameliorer la production 
en macrolides d'un microorganisme. 

55) Un autre aspect de 1'invention concerne un microorganisme mutant 
producteur de macrolide caracterise en ce qu'il possede une modification genetique dans 
au moins un gene comprenant une sequence selon l'un des paragraphes 1), 2), 3), 4), 5) 
ou 6) ci-dessus et/ou qu'il surexprime au moins un gene comprenant une sequence selon 
l'un des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus. 
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56) Un autre aspect de 1' invention concerne un microorganisme mutant selon le 
paragraphe 55) ci-dessus caracterise en ce que la modification genetique consiste en une 
suppression, une substitution, une deletion et/ou une addition d'une ou plusieurs bases 
dans le ou les* genes consideres dans le but d'exprimer une ou des proteines ayant une 

5 activite superieure ou d'exprimer un niveau plus eleve de cette ou de ces proteines. 

57) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 
paragraphe 55) ci-dessus caracterise en ce que la surexpression du gene considere est 
obtenue en augmentant le nombre de copie de ce gene et/ou en plapant un promoteur 
plus actif que le promoteur sauvage. 

10 58) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 

paragraphe 55) ou 57) ci-dessus caracterise en ce que la surexpression du gene 
considere est obtenue en transformant un microorganisme producteur de macrolide par 
une construction d'ADN recombinant selon le paragraphe 13, 14 ou 17 ci-dessus, 
permettant la surexpression de ce gene. 

15 59) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 

paragraphe 55), 56), 57) ou 58) ci-dessus caracterise en ce que la modification 
genetique est effectuee dans un ou plusieurs genes comprenant une des sequences 
correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 
19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 

20 78, 80, 82 et 84 ou Pun de ses variants ou Pune des sequences derivees de celles-ci en 
raison de la degenerescence du code genetique. 

60) Un autre aspect de Pinvention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58) ou 59) ci-dessus caracterise le microorganisme surexprime 
un ou plusieurs genes comprenant une des sequences correspondant a une ou plusieurs 
25 des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 
43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou Pun de ses 
variants ou Pune des sequences derivees de celles-ci en raison de la degenerescence du 
code genetique. 
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61) Un autre aspect de 1'invention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59) ou 60) ci-dessus caracterise en ce que ledit 
microorganisme est une bacteries du genre Streptomyc.es. _ 

62) Un autre aspect de 1'invention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59), 60) ou 61) ci-dessus caracterise en ce que le 
macrolide est la spiramycine. 

63) Un autre aspect de 1'invention concerne un microorganisme mutant selon le 
paragraphe 55), 56), 57), 58), 59), 60), 61) ou 62) ci-dessus caracterise en ce que ledit 
microorganisme est une souches de S. ambofaciens. 

64) Un autre aspect de 1'invention concerne un precede de production de 
macrolides, caracterise en ce qu'il comprend les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon l'un 
des paragraphes 55), 56), 57), 58), 59), 60), 61), 62), 63) ou 64) ci-dessus, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
1'extrait cellulaire obtenu a 1 'etape b), le ou lesdits macrolides produits. 

65) Un autre aspect de 1'invention concerne 1 'utilisation d'une sequence et/ou 
d'un ADN recombinant et/ou d'un vecteur selon l'un des paragraphes 1), 2), 3), 4), 5), 
6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16) ou 17) ci-dessus pour la preparation 
d'antibiotiques hybrides. 

66) Un autre aspect de 1'invention concerne l'utilisation d'au moins un 
polynucleotide et/ou au moins un ADN recombinant et/ou au moins un vecteur 
d'expression et/ou au moins un polypeptide et/ou au moins une cellule hote selon l'un 
des paragraphes 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14), 15), 16), 17) ou 
21) ci-dessus pour realiser une ou plusieurs bioconversions. 
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67) Un autre aspect de Pinvention concerne un polynucleotide caracterise en ce 
qu'il s'agit d'un polynucleotide complementaire de Tun des polynucleotides selon le 
paragraphe 1), 2), 3) 3 4), 5), ou 6) ci-dessus. 

Definitions generates 

Le terme " isole " au sens de la presente invention designe un materiel biologique 
(acide nucleique ou proteine) qui a ete soustrait a son environnement originel 
(renvironnement dans lequel il est localise naturellement). 

Par exemple un polynucleotide present a Petat naturel dans une plante ou un 
animal n'est pas isole. Le meme polynucleotide separe des acides nucleiques adjacents 
au sein desquels il est naturellement insere dans le genome de la plante ou Panimal est 
considere comme " isole ". 

Un tel polynucleotide peut etre inclus dans un vecteur et/ou un tel polynucleotide 
peut etre inclus dans une composition et demeurer neanmoins a 1'etat isole du fait que le 
vecteur ou la composition ne constitue pas son emdronnement naturel. 

Le terme " purifie " ne necessite pas que le materiel soit present sous une forme de 
purete absolue, exclusive de la presence d'autres composes. II s'agit plutot d'une 
definition relative. 

Un polynucleotide est a Tetat " purifie " apres purification du materiel de depart 
ou du materiel naturel d'au moins uri ordre de grandeur, de preference 2 ou 3 et 
preferentiellement 4 ou 5 ordres de grandeur. 

Aux fins de la presente invention le terme ORF (« Open Reading Frame », c'est a 
dire cadre ouvert de lecture) a ete employe pour designer en particulier la sequence 
codante d'un gene. 
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Aux fins de la presente description; 1 'expression " sequence nucleotidique " peut 
etre employee pour designer indifferemment un polynucleotide ou un acide nucleique. 
... L ' expression " sequence nucleotidique " englobe le materiel genetiqueJui-meme et n 'est 
done pas restreinte a l'information concernant sa sequence. 

Les termes " acide nucleique ", " polynucleotide ", " oligonucleotide " ou encore " 
sequence nucleotidique " englobent des sequences d'ARN, d'ADN, d'ADNc ou encore 
des sequences hybrides ARN/ADN de plus d'un nucleotide, indifferemment sous la 
forme simple chaine ou sous la forme de duplex. 

Le terme " nucleotide " designe a la fois les nucleotides naturels (A, T, G, C) ainsi 
que des nucleotides modifies qui comprennent au moins une modification telle que (1) 
un analogue d'une purine, (2) un analogue d'une p 5 Timidine, ou (3) un sucre analogue, 
des exemples de tels nucleotides modifies etant decrits par exemple dans la demande 
PCT N°WO 95/04 064. 

Aux fins de la presente invention, un premier polynucleotide est considere comme 
etant " complementaire " d'un second polynucleotide lorsque chaque base du premier 
polynucleotide est appariee a la base complementaire du second polynucleotide dont 
l'orientation est inversee. Les bases complementaires sont A et T (ou A et U), ou C et G. 

Le terme « genes de la voie de biosynthese des spiramycines » comprend 
egalement les genes regulateurs et les genes conferant la resistance aux microorganismes 
20 producteurs. 

On entendra par " fragment " d'un acide nucleique de reference selon 1 'invention, 
une sequence nucleotidique de longueur reduite par rapport a 1'acide nucleique de 
reference et comprenant, sur la partie commune, une sequence en nucleotides identique a 
1'acide nucleique de reference. 
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Un tel " fragment " d'acide nucleique selon l'invention peut etre le cas echeant, 
compris dans un polynucleotide plus grand duquel il est constitutif. 
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De tels fragments comprennent on alternativement consistent en, des 
polynucleotides de longueur allant de 8, 10, 12, 15, 18, 20 a 25, 30, 40, 50, 60, 70, 80, 
90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 
950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 
1650, 1700, 1750, 1800, 1850 ou 1900 nucleotides consecutifs d'un acide nucleique 
selon T invention. 

Par " fragment " d'un polypeptide selon I'invention, on entendra un polypeptide 
dont la sequence d'acides amines est plus courte que celle du polypeptide de reference et 
qui comprend sur toute la partie commune avec ces polypeptides de reference, une 
sequence en acides amines identique. 

De tels fragments peuvent, le cas echeant, etre compris au sein d'un polypeptide 
plus grand duquel ils font partie. ^ 

De tels fragments d'un polypeptide selon r invention peuvent avoir une longueur 
de 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240,260- 
280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 
ou 640 acides amines. 

Par " conditions d'hybridation de forte stringence " au sens de la presente 
invention, on entendra des conditions d'hybridation defavorisant l'hybridation de brins 
d'acides nucleiques non homologues. Des conditions d'hybridations de forte stringence . 
peuvent etre par exemple decrites comme des conditions d'hybridation dans le tampon 
decrit par Church & Gilbert (Church & Gilbert, 1984) srune temperature comprise entre. 
55°C et 65°C, de maniere preferee la temperature d'hyridation est de 55°C, de maniere 
encore plus preferee la temperatue d'hybridation est de 60°C et de maniere tout a fait 
preferee la temperature d'hybridation est de 65°C, suivi d'un ou plusieurs lavages 
effectue en tampon 2X SSC (le tampon IX SSC correspond a une solution aqueuse 
0,1 5M NaCI, 15 raM de citrate de sodium) a une temperature comprise entre 55°C et 
65°C, de maniere preferee cette temperature est de 55°C, de maniere encore plus 
preferee cette temperatue est de 60°C et de maniere tout a fait preferee cette temperature 



1er depot 



19 



est de 65°C, suivi d'un ou plusieurs lavages en tampon 0.5X SSC a une temperature 
comprise entre 55°C et 65°C, de maniere preferee cette temperature est de 55°C, de 
maniere encore plus prefer 
preferee cette temperature est de 65 °C. 

H va sans dire que les conditions d'hybridation ci-dessus decrites peuvent etre 
adaptees en fonction de la longueur de l'acide nucleique dont l'hybridation est 
recherchee ou du type de marquage choisi, selon des techniques connues de 1'homme du 
metier. Les conditions convenables d'hybridation peuvent par exemple etre adaptees 
selon I'ouvrage de FAusubel et al (2002). 

Par " variant " d'un acide nucleique selon 1'invention, on entendra un acide 
nucleique qui differe d'une ou plusieurs bases par rapport au polynucleotide de 
reference. Un acide nucleique variant peut etre d'origine naturelle, tel qu'un variant ; 
allelique retrouve naturellement, ou peut etre aussi un variant non naturel obtenu par 
exemple par des techniques de mutagenese. 

En general, les differences entre l'acide nucleique de reference et l'acide nucleique 
variant sont reduites de telle sorte que les sequences nucleotidiques de l'acide nucleique 
de reference et de l'acide nucleique variant sont tres proches et, dans de nombreuses 
regions, identiques. Les modifications de nucleotides presentes dans un acide nucleique 
variant peuvent etre silencieuses, ce qui signifie qu'elles n'alterent pas les sequences 
d'aminoacides codees par ledit acide nucleique variant. 

Cependant, les changements de nucleotides dans un acide nucleique variant 
peuvent aussi resulter de substitutions, additions, deletions dans le polypeptide code par 
l'acide nucleique variant par rapport aux peptides codes par l'acide nucleique de 
reference. En outre, des modifications de nucleotides dans les regions codantes peuvent 
produire des substitutions, conservatives ou non conservatives dans la sequence 
d'aminoacides. 



m 



1er depot 



20 

De preference, les acides nucleiques variants selon 1'invention codent des 
polypeptides qui conservent sensiblement la meme fonction ou activite biologique que le 
polypeptide de Facide nucleique de reference ou encore la capacite a etre reconnus par 
des anticorps diriges contre les polypeptides codes par Facide nucleique initial. 

5 Certains acides nucleiques variants coderont ainsi des formes mutees des 

polypeptides dont F etude systematique permettra de deduire des relations structure 
activite des proteines en question. 

Par " variant " d'un polypeptide selon 1' invention, on entendra principalement un 
polypeptide dont la sequence d'acides amines contient une ou plusieurs substitutions, 
10 additions ou deletions d'au moins un residu d'acide amine, par rapport a la sequence 
d'acides amines du polypeptide de reference, etant entendu que les substitutions 
d'aminoacides peuvent etre indifferemment conservatives ou non conservatives. 

De preference, les polypeptides valiants selon 1'invention consen^ent sensiblement 
la meme fonction ou activite biologique que le polypeptide de reference ou encore la 
15 capacite a etre reconnus par des anticorps diriges contre les polypeptides initiaux. 

Par polypeptide ayant " une activite similaire " a un polypeptide de reference' au 
sens de 1'invention, on en tend un polypeptide ayant une activite biologique proche, mais 
pas necessairement identique, de celle du polypeptide de reference tel que mesure dans 
un essai biologique convenable a la mesure de Factivite biologique du polypeptide de 
20 reference. 

Par " antibiotique hybride " au sens de 1'invention on en tend un compose, genere 
par la construction d'une voie de biosynthese artificielle utilisant la technologie de 
l'ADN recombinant. 
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Description detaillee de I 'invention 

La presente invention a plus particulierement pour objet, de nouveaux genes de la 
voie ~de biosynthese des spiramycines et de nouveaux polypeptides impliques dans cette 
biosynthese tels que presentes dans la description detaillee ci-dessous. 

Les genes de la voie de biosynthese ont ete clones et la sequence d'ADN de ces 
genes a ete determines Les sequences obtenues ont ete analysees grace au programme 
FramePlot (Ishikawa J & Hotta K. 1999). On a identifie, parmi les phases ouvertes de 
lecture, les phases ouvertes de lecture presentant un usage des codons typiques de 
Streptomyces. Cette analyse a montre que cette region comporte 35 ORFs localises de 
part et d'autre de cinq genes codant I 'enzyme «polyketide synthase » (PKS). De part et 
d'autre de ces cinq genes codant des PKS, respectivement 10 et 25 ORFs ont ete 
identifies en aval et en amont (l'aval et l'amont etant definis par 1'orientation des 5 
genes de PKS tons orientes dans le meme sens) (cf. figure 3). Ainsi, les 25 phases 
ouvertes de lecture de ce type, occupant une region d'environ 31 kb (SEQ ID N° 1 et 
figure 3) ont ete identifiees en amont des 5 genes codant la PKS et 10 occupant une 
region d'environ 11,1 kb (SEQ ID N° 2 et figure 3), ont ete identifiees en aval des genes 
de la PKS. Les 10 genes situes en aval des 5 genes PKS ont ainsi ete nommes or/l*c, 
or/2*c, orf3*c, orf4*c, or/5*, or/6* orp*c, or/8* or/9* or/70* (SEQ ID N° 3, 5, 7, 9, 
1 1, 13, 15, 17, 19 et 21). Le « c » ajoute dans le nom du gene signifiant pour 1'ORF en 
question que la sequence codante est dans 1'orientation inverse (le brin codant est done 
le brin complements de la sequence donnee en SEQ ID N° 2 pour ces genes). En 
utilisant la meme nomenclature, les 25 ORFs en amont des genes de la PKS ont ete 
nommes or/1, or/2., or/3, or/4, or/5, or/6, or/7, or/8, or/9c, or/10, or/llc, or/12, or/13c, 
or/14, or/1 5c, or/16, or/17, or/18, or/19, or/20, orfile, orf22c, or/23c, or/24c et orf25c 
(SEQ ID N° 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 
76, 78, 80, 82 et 84) (cf. figure 3). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
comparees avec ceiles presentes dans differentes bases de donnees grace a differents 
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programmes : BLAST (Altschul et ah, 1990) (Altschul et aL, 1997), CD-search, COGs 
(Cluster of Orthologous Groups) (ces trois progranrmes sont accessibles notamment 
aupres du National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, 
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), 
5 BEAUTY (Worley K. C. et aL, 1995)), (ces deux programmes sont accessibles 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d' identifier ceux susceptibles d'etre impliques dans la biosynthese des 
spiramycines. 

10 Genes situes en aval des genes codant les PKS 

Une representation schematique de 1' organisation de la region est presentee en 
figure 3. Ainsi qu'il sera demontre ci-dessous 3 sur les 10 genes identifies en aval des 
genes codant les PKS 9 semblent impliques dans la biosynthese ou la resistance aux 
spiramycines. H s'agit des 9 genes suivants : orfl*c t orf2*c, orf3*c, orf4*c, orf5*, orf6*, 
15 orf7*c, orf8* et orf$>* "'I 

Dans le tableau 1 suivant sont presentees les references a la sequence en ADN et 
en acides amines des 10 genes identifies en aval des 5 genes PKS. 



Tableau 1 



Gene 


Position dans la 
sequence SEQ ID NO 2. 


Sequence ADN 


Sequences polypeptidiques 


orfl *c 


10882 a 10172 


SEQ ID NO 3 


SEQ ID NO 4 


orf2*c 


10052 a 8781 


SEQ ID NO 5 


SEQ ID NO 6 


orf3*c 


8741 a 7476 


SEQ ID NO 7 


SEQ ID NO 8 


orf4*c 


7459 a 6100 


SEQ ID NO 9 


SEQ ID NO 10 


orf5* 


5302 a 5976 


SEQ ID NO 11 


SEQ ID NO 12 


or/6* 


4061 a 5305 


SEQ ID NO 13 


SEQ ID NO 14 
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orf7*c 


3665 a 2817 


SEQIDNO 15 


SEQIDNO 16 


orJS* 


1925 a 2755 


SEQIDNO 17 


SEQIDNO 18 


or/9*' 


1007 a 1888 


SEQIDNO 19 


SEQ ID NO 20 


or/ JO* 


710 a 937 


SEQIDNO 21 


SEQ ID NO 22 



Le « c » ajoute dans le nom du gene indique que la sequence codante est dans 
l'orientation inverse (le brin codant est done le brin complements de la sequence 
donnee en SEQ ID N° 2 pour ces genes). 

Dans le but de determiner la fonction des polypeptides identifies, trois types 
d'experiences ont ete menes : la comparaison des sequences identifies avec des 
sequences de fonctions connues, des experiences d'inactivation de genes, conduisant a la 
construction de souches mutantes et des analyses de la production en spiramycines et en 
intermediaires de biosynthese des spiramycines par ces souches mutantes. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont tout 
d'abord ete comparees avec celles presentes dans differentes bases de donnees grace a 
different programmes : BLAST (Altschul et al., 1990) (Altschul et al, 1997), CD- 
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J. 
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C. et al, 1995)). Ces 
comparisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycine. Le tableau 2 montre les proteines presentant une forte similitude avec les 
produits 10 genes situes en aval des 5 genes PKS. 
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Tableau 2 



Produit 
Hp (ypnp 


Proteine presentant une 

<?imi"1ifnHp <?iOTnfi cativp 

Oil 1 11.11 tU.VJ.V' JJCyl I 1 JLXwCLLJ V V- 


Numero d'acces 

CiPnRpmlr 

VJ JJL-J CXI 1IV 


Score 
BT A.ST* 


Fonction rapportee 


orfl*c 


TylMI(orf3*) (S.fradiae) 


CAA57473 


287 


N- 

m pf Vi vl fran cifpr ^ « p 

Illt/Lll_y 1L1 CUlOlVl UOC 


orf2*c 


dnrQ gene product 


AAD 15266 


153 


Inconnue 


or/3*c 


TylMII(orf2*) (S.fradiae) 


CAA57472 


448 


Gly co syltransferas 

p. 


orf4*c 


Crotonyl-CoA reductase 
(5. coelicolor) 


NP_630556 


772 


Crotonyl-CoA 
reductase 


or/5* 


MdmC (£ mycarofaciens) 


B42719 


355 


O 

methyltraxisferase 


orf6* 


3 -O-acyl transferase (5. 
mycarofaciens) 


Q00718 


494 


Acyltransferase^ 


orf7*c 


MdmA (£ 
mycarofaciens) 


A60725 


380 


Proteine impliquee 
dans la resistance 
a la midecamycine 




A Rr^-trariQnnrfpnr f.^* 
griseus) 




1 Q1 

171 


A R - tm n cr^oTf^i 1 v 

r\AD\^~\A Ctllk>jJ\Jl It LI I 


or/9* 


ABC -trail sport ear (£. 


CAC22118 


269 


AB C-transporteur 


or/70* 


Putative small conserved. , 
hypothetical protein (5. 
coelicolor) 


NP_627432 


109 


Inconnue 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al, 1990). 

Des experiences deactivation de genes ont ete realisees pour confirmer ces resultats. 
Les methodes utilisees consistent a effectuer un remplacement de gene. Le gene cible a 
interrompre est remplace par une copie de ce gene interrompue par une cassette 
conferant la resistance a un antibiotique (par exemple I'apramycine, la geneticine ou 
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Phygromycine). Les cassettes utilisees sont bordees de part et d'autre par des codons de 
terminaison de la traduction dans toutes les phases de lecture et par des terminateurs de 
transcription actifs chez Streptomyces. L'insertion de la cassette dans le gene cible peut 
s'accompagner ou non d'une deletion dans ce gene cible. La taille des regions flanquant 
la cassette peut aller de quelques centaines a plusieurs milliers de paires de bases. Un 
deuxieme type de cassettes peut etre utilise pour l'inactivation de genes : des cassettes 
dites « cassettes excisables ». Ces cassettes presentent l'avantage de pouvoir etre 
excisees chez Streptomyces par un evenement de recombinaison de site specifique apres 
avoir ete introduites dans le genome de S. ambofaciens. Le but est d'inactiver certains 
genes dans des souches de Streptomyces sans laisser dans la souche finale de marqueurs 
de selection ou de grandes sequences d'ADN n'appartenant pas a la souche. Apres 
excision il subsiste uniquement une courte sequence d'une trentaine de paires de bases 
(appele site « cicatriciel ») dans le genome de la souche (cf. figure 10). La mise en 
oeuvre de ce systeme consiste, dans un premier temps, au remplacement de la copie 
sauvage du gene cible (grace a deux evenements de recombinaison homologue, cf. 
figure 9) par une construction dans laquelle une cassette excisable a ete inseree dans ce 
gene cible. L'insertion de cette cassette est accompagnee d'une deletion dans le gene 
cible (cf. figure 9). Dans un deuxieme temps, 1'excision de la cassette excisable du 
genome de la souche est provoquee. La cassette excisable fonctionne grace a un systeme 
de recombinaison site specifique et a pour avantage de permettre l'obtention de mutants 
de Streptomyces ne portant finalement pas de gene de resistance. On s'affranchit 
egalement d'eventuels effets polaires sur 1'expression des genes situes en aval du ou des 
genes inactives (cf. figure 10). Les souches ainsi construites ont ete testees pour leur 
production en spiramycines. 

L'inactivation des genes orfl*c, orf2*c, orfi*c et or/4*c n'a pas ete effectuee car 
les experiences de comparaison de sequence ont permis de determiner que ces genes 
avaient une similitude relativement importante avec des genes impliques dans la 
biosynthese d'un antibiotique relativement proche. Ainsi, le gene orfl*c code une 
proteine presentant une identite de 66% (determinee grace au programme BLAST) avec 
la proteine codee par gene tylMI qui code une N-methyltransferase impliquee dans la 
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biosynthese de tylosine et catalysant la 3 N-methylation durant la production du 
mycaminose chez Streptomyces fradiae (Gandecha,A.R. et aL, 1997 ; Numero d'acces 
GenBank : CAA57473 ; Score BLAST : 287). Cette similitude avec une proteine 
impliquee dans la voie de biosynthese d'un autre antibiotique relativement proche et 
plus particulierement dans la biosynthese du mycaminose suggere que le gene orfl*c 
code une N-methyltransferase responsable d'une N-methylation lors de la biosynthese de 
la forosamine ou du mycaminose (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
que la proteine codee par le gene orfl*c presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 3). 



Tableau 3 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee . 


methyltransferase (S. antibioticus) 


CAA05643 


277 


methyltransferase 


N ? N-dimethyltransferase (S. venezuelae) 


AAC68678 


268 


N,N- " l ' • 
dimethyltransferase 


probable N-methylase snogX (S. 
nogalater) 


T46679 


243 


N~methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al. 9 1 990). 



Le gene orf2*c code une proteine presentant une relative forte similitude (35% 
d'identite) avec une proteine codee par le gene tylMIII codant une NDP hexose 3 3 4 
isomerase impliquee dans la biosynthese de la tylosine chez Streptomyces fradiae 
(Gandecha 5 A.R. ; et ah, 1997 ; Numero d'acces GenBank : CAA57471 ; Score BMAST : 
130). Cette similitude avec une proteine impliquee dans la voie de biosynthese d'un 
autre antibiotique proche et plus particulierement dans la biosynthese du mycaminose 
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suggere fortement que le gene orf*2c code une NDP hexose 3,4 isomerase responsible 
d'isomerisation lors de la biosynthese du mycaminose (cf. figure 5). 

Le gene orfB*c code une proteine presentant une relative forte similitude (59% 
d'identite) avec une proteine codee par le gene tylMII codant une glycosyltransferase 
impliquee dans la biosynthese de la tylosine chez Streptomyces fradiae (Gandecha,A.R. 
et al, 1997; Numero d"acces GenBank: CA^57472 ; Score BLAST: 448). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique proche suggere fortement que le gene orf*3c code une glycosyltransferase. 
Cette hypothese est etayee par le fait que la proteine codee par le gene or/3*c presente 
une forte, similitude avec d'autres proteines de fonction similaire chez d'autres 
organismes (cf. tableau 4). 



Tableau 4 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glycosyl transferase (S. venezuelae) 


AAC68677 


426 


Glycosyltransferase 


Glycosyltransferase (S. antibioticus) 


CAA05642 


425 


Glycosyltransferase 


Glycosyltransferase 
(Saccharopolyspora eiythraed) 


CAA74710 


395 


Glycosyltransferase 


Glycosyltransferase (S. antibioticus) 


CAA05641 


394 J 


Glyco syl transferas e 



eleve (Altschul et al, 1990). 



a un score BLAST plus 



Le gene orf4*c code une proteine presentant une relative forte similitude avec 
plusieurs crotonyl-CoA reductases. NotammenL la proteine codee par orf4*c possede 
une similitude importante avec une crotonyl CoA reductase de chez Streptomyces 
coelicolor (Redenbach,M et al, 1996 ; Numero d'acces GenBank : NP_630556 ; Score 
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BLAST : 772). Cette similitude avec .une proteine impliquee dans la voie de biosynthese 
d'un autre antibiotique proche suggere fortement que le gene orf4*c code egalement une 
crotonyl-CoA reductase. Cette hypothese est etayee par le fait que la proteine codee par 
le gene orf4*c presente une forte similitude avec d'autres proteines de fonction similaire 
5 chez d'autres organismes (cf. tableau 5). 



Tableau 5 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


trans-2-enoyl-CoA reductase 
(ECL3T.38)(^. collinus) 


S72400 


764 


trans-2-enoyl-CoA 
reductase 


Crotonyl Co A reductase (S.fradiae) 


CAA57474 


757 


Crotonyl Co A reductase 


Crotonyl-CoA reductase (S. 
cinnamonensis) 


AAD53915 


747 


Crotonyl-CoA reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1990). 



Le gene or/6* presente une certaine similitude avec le gene mdmB present chez 
10 Streptomyces mycarofaciens (Hara et Hutchisnson, 1992 ; numero d'acces GenBank : 
A42719 ; Score BLAST : 489) producteur d' antibiotique macrolide. Chez ce producteur, 
le gene est implique dans Pacylation du cycle lactone. Le gene or/6* coderait done une 
acyltransferase. Cette h\^pothese est etayee par le fait que la proteine codee par le gene 
off 6^ presente une forte similitude avec d'autres proteines de fonction similaire chez 
15 d'autres organismes (cf tableau 6). 
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Tableau 6 



Proteine presentant une 
similitude significative 


Numero 
d'acces _ 
GenBank 


Score 
BLAST* 


Fonction rapportee 


AcyA (Streptomyces 
thermotolerans) 


J4001 


450 


macrolide 3-O-acyltransferase 


Midecamycine 4"-0- 
propionyl transferase (S. 
mycarofaciens) 


BAA09815 


234 


transferase 


Mycarose O-acyltransferase 
{Micromonospora 
megalomicea subsp. Nigra) 


AAG13909 


189 


Mycarose O-acyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al., 1990). 

L'inactivation du gene orf6* a ete realisee par une deletion/insertion en phase et il . 
a ete montre que la souche resultante ne produit plus de spiramycine II et m mais : 
uniquement de la spiramycine I (cf figure 1). Ceci confirme que le gene or/6* est bien 
implique dans la synthese de spiramycine II et III. L'enzyme codee par ce gene est 
responsable de la formation de spiramycine II et III par fixation d'un groupement acetyl 
ou butyryl sur le carbone 3. Les souches n'exprimant plus la proteine codee par le gene 
orf6* sont particulierement interessantes puisqu'elles ne produisent plus de spiramycine 
II et III mais seulement de la spiramycine I. Comme il a ete precise ci-dessus, l'activite 
antibiotique de la spiramycine I est nettement superieure a celle des spiramycines II et III 
(Liu etai, 1999). 

Le gene or/5* code une proteine presentant une relative forte similitude avec 
plusieurs O-methyltransferase. Notamment, la proteine codee par or/5* possede une 
similitude importante avec une O-methyltransferase (EC 2.1.1.-) MdmC de 
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Streptomyces mycarofaciens (Hara & Hutchinson, 1992; Numero d'acces 
GenBank :B42719; Score BLAST : 355). Cette similitude avec une proteine impliquee 
dans la voie de biosynthese d'un autre antibiotique suggere fortement que le gene orf5* 
code egalement une O-methyltransferase. Le gene or/5* serait implique dans la 
formation de precurseurs incorpores dans le cycle lactone. En effet, d'apres les 
comparaisons de sequences, le produit du gene or/5* est egalement relativement proche 
de FkbG qui est responsable de la methylation de Phydroxymalonyl-ACP d'apres (Wu et 
al, 2000 ; Hofftneister et aL, 2000 ; Numero d'acces GenBank : AAF86386 ; Score 
BLAST : 247) (c£ figure 8). Cette hypothese est etayee par le fait que la proteine codee 
par le gene or/5* presente une forte similitude avec d'autres proteines de fonction 
similaire chez d'autres organismes (cf. tableau 7). 



Tableau 7 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Probable O-methj'ltransferase (EC 
2.1.1.-) safC (Myxococcus xanthus) 


T18553 


223 


O-methyltransferase 


4-O-methyltransferase (EC 2.1.1.-)- 
{Streptomyces sp.) 


JC4004 


222 


O-methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
el eve (Altschul et aL, 1990). 



Grace a Teffet polaire de I'msertion d'une cassette non excisee dans le gene or/6*, 
il a pu etre determine que le gene orf 5* est essentiel a la voie de biosynthese des 
spiramycines. En effet, l'insertion de la cassette excisable dans lapartie codante du gene 
orf '6* entraine un arret total de la production en spiramycines. Cependant, une fois que 
la cassette inseree a ete excisee (et done lorsque seul le gene orf 6* est inactive, cf 
exemples 14 et 15), on retrouve une production en spiramycine I. Ceci montre que le 



1er depot 



31 

gene orf 5* est essentiel a la voie de biosynthese des spiramycin es puisque son 
inactivation entraine un arret total de la production en spiramycines. 

_ Le-gene ^//7*c-code-une~proteine~present^ 

proteine codee par le gene mdmA de Streptomyces mycarofaciens, ce dernier codant une 
5 proteine impliquee dans la resistance a la midecamycine chez cet organisme producteur 
(Hara et al 9 1990 ; Numero d'acces GenBank : A60725 ; Score BLAST : 380). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique suggere fortement que le gene orf7*c code egalement une proteine 
impliquee dans la resistance a la spiramycine. Plus particulierement, Penzyme codee par 

10 le gene orp*c possede une activite methyltransferase et est impliquee dans la resistance 
a la spiramycine chez Streptomyces ambofaciens. U a ete demontre que ce gene confere 
une resistance de type MLS I 3 resistance dont on sait qu'elle est due a la mono- 
methylation en position A2058 de TARN ribosomal 23 S (Pernodet et al 9 1996). Cette 
hypothese est etayee par le fait que la proteine codee par le gene orf7*c presente une 

15 forte similitude avec d'autres proteines de fonction similaire chez d'autres organismes 
(cf. tableau 8). 



Tableau 8 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


macrolide-lincosamide-streptogramin B 
resistance determinant (S. fradiae) 


JC5319 


238 


23 S rRNA 
methyltransferase 


23 S ribosomal RNA method transferase 
ErmML {Micrococcus luteiis) 


AAL68827 


119 


23 S rRNA 
methyl transferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 



eleve (Altschul et al., 1990). 
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Le gene or/8* code une proteine presentant line relative forte similitude avec une 
proteine de type transporter ABC chez Streptomyces griseus (Campelo, 2002. Numero 
d'acces GenBank : CAC221 19 ; Score BLAST : 191). Cette similitude avec une proteine 
de type transporteur ABC suggere fortement que le gene orfS* code egalement une 
5 proteine de type transporteur ABC pouvant etre impliquee dans la resistance a la 
spiramycine. Cette hypothese est etayee par le fait que la proteine codee par le gene 
orjS* presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 9). 



Tableau 9 



Proteine presentant une similitude 
significative 


Numero d'acces 
GenBank 


Score 
BLAST* 


Fonction 
rapportee 


AcrW {Streptomyces galilaeus) 


BAB72060 


94 


Transporteur 
ABC 


Daunorubicin resistance transmembrane 
proteine {Streptomyces peucetius) 


P32011 


89 


Resistance a la 
daunorubicine 


Probable ABC-transporter, 
transmembrane component. 
{Streptomyces coelicolor) 


NP_626506 


89 


Transporteur 
ABC 



10 * une plus grande similitude de sequence est associee a un score BLAST plus elev6 
(Altschul etal, 1990). 

Le gene c?/;/9* code une proteine presentant une relative forte similitude avec une 
proteine de type transporteur ABC chez Streptomyces griseus (Campelo, 2002, Numero 
d'acces GenBank : CAC221 18 ; Score BLAST : 269). Cette similitude avec une proteine 
15 de type transporteur ABC suggere fortement que le gene or/9* code egalement une 
proteine de type transporteur ABC pouvant etre impliquee dans la resistance a la 
spiramycine. Cette hypothese est etayee par le fait que la proteine codee par le gene 
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or/8* presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 10). 

Tableau 10 



Proteine presentant une similitude significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction 
rapportee 


Probable ABC-type transport protein, ATP- 
binding component (S. coelicolor) 


NP„626505 


231 


Transporteur 
ABC 


Putative ABC transporter ATP-binding 
component (Streptomyces Coelicolor) 


NP_627624 


228 


Transporteur 
ABC 



* une plus grande similitude de sequence est associee a un score BLAST plus eleve 
(Altschul etal, 1990). 

Le gene orfl 0* code une proteine presentant une relative forte similitude avec une 
proteine de fonction inconnue. Cependant des genes similaires a or/10* sont retrouves 
au milieu de plusieurs groupes de genes impliques dans la biosynthese d'antibiotiques. 
Ainsi un gene proche de orflO* est retrouve chez S. coelicolor (Redenbach et al., 1996, 
numero d'acces GenBank : NP_627432, score BLAST : 109). Un gene proche (CouY) 
est egalement retrouve chez S. rishiriensis (Wang et al, 2000, numero d'acces 
GenBank : AAG29779, score BLAST 97). 

Genes situes en amont des genes codant les PKS 

Dans la sequence d'ADN situee en amont des genes codant les PKS (Laval et 
l'amont etant defini par 1 'orientation des 5 genes de PKS tous orientes dans le meme 
sens) (cf. figure 3), 25 ORFs ont ete identifies (cf. ci-dessus). Une representation 
schematique de 1' organisation de la region est presentee en figure 5. Les 25 genes 
identifies ont ete nommes : orfl, orf2, or/3, or/4, or/5, or/6, or/7, or/8, orJ9c, orflO, 
orfl 1 c, orfl 2, orfl 3c, orfl 4, orfl 5c, orfl 6, orfl 7, orfl 8, orfl 9, orf20, orf21c, orf22c, 
orflSc, orf24c et orf25c. 
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Dans le tableau 1 1 suivant sont presentees les references a la sequence en ADN et 
en acides amines des 25 genes identifies en amont des 5 genes PKS. 

Tableau 1 1 



Gene 1 


Position dans la 
sequence ID NO : 1 


Sequence ADN 


Sequence(s) polypeptidique(s) 2 


orfl 


658 a 1869 


SEQ ID NO 23 


SEQIDNO 24 


or/2 


1866 a 2405 ^ 


SEQIDNO 25 


SEQ ID NO 26 et 27 


or/3 


2402 a 3568 


SEQ ID NO 28 


SEQIDNO 29 


or/4 


3565 a 4473 


SEQIDNO 30 


SEQIDNO 31, 32et33 


orfS 


4457 a 5494 


SEQIDNO 34 


SEQIDNO 35 


or/6 


5491 a 6294 


SEQIDNO 36 


SEQIDNO 37, 38 et 39 


or/7 


6296 a 7705 


SEQ ID NO .40 


SEQIDNO 41 et42 


or/8 


8011 a 9258 


SEQIDNO 43 


SEQIDNO 44 * 


orfPc 


10081 a 9362 


SEQIDNO 45 


SEQIDNO 46 


orflO 


10656 a 12623 


SEQIDNO 47 


SEQIDNO 48 


orfl 1 c 


14482 a 12734 


SEQIDNO 49 


SEQIDNO 50, 51 et 52 


orfl2 


14601 a 16031 


SEQIDNO 53 


SEQ ID NO 54, 55, 56, 57, 58 et 59 


orfl3c 


17489 a 16092 


SEQIDNO 60 


SEQIDNO 61 


orfl4 


17809 a 18852 


SEQIDNO 62 


SEQ ID NO 63 


orfl 5 c 


20001 a 18961 


SEQIDNO 64 


SEQ ID NO 65 


orfl 6 


20314 a 21552 


SEQIDNO 66 


SEQIDNO 67 


orfl 7 


21609 a 22879 


SEQIDNO 68 


SEQ ID NO 69 


or/78 


22997 a 241 75 


SEQIDNO 70 


SEQIDNO 71 


orfl9 


24177 a25169 


SEQIDNO 72 


SEQIDNO 73 
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orfiO 


25166 a 26173 


SEQ ID NO 74 


SEQ ID NO 75 


orfllc 


27448 a 26216 


SEQIDNO 76 


SEQIDNO 77 


or/2 2 c 


28560 a 27445 


SEQ ID NO 78 


SEQIDNO 79 


orf23c 


29770 a 28649 


SEQIDNO 80 


SEQIDNO 81 


orf24c 


30074 a 29763 


SEQIDNO 82 


SEQIDNO 83 


orf25c 
t 


30937 a 30071 


SEQIDNO 84 


SEQIDNO 85 



l'orientation inverse (le brin codant est done le brin complements de la sequence 
donnee en SEQ ID N° 1 pour ces genes). 

Lorsque plusieurs sequences proteiques sont indiquees pour une seule orf, les 
proteines correspondantes sont issues de plusieurs sites possibles de demarrage de la 
traduction. 

Dans le but de determiner la fonction des polypeptides identifies dans le tableau 1 1 
ci-dessus, trois types d'experiences ont ete menees : la comparison de 1'identite des 
sequences identifies avec des sequences de fonctions connues, des experiences' 
d'inactivation de genes et des analyses de la production en spiramycins de ces souches 
mutantes. 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont tout 
d'abord ete comparees avec celles presentes dans differentes bases de donnees grace a 
differents programmes: BLAST (Altschul et al., 1990) (Altschul et al, 1997), CD- 
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J. 
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C. et al., 1995)), (cf. ci- 
dessus). Ces comparaisons ont permis de formuler des hypotheses sur la fonction des 
produits de ces genes et d'identifier ceux susceptibles d'etre impliques dans la 
biosynthese de spiramycine. Le tableau 12 montre les proteines presentant une forte 
similitude avec les 25 genes situes en amont des 5 genes PKS. 
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Tableau 12 



Gene 


Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction 
rapportee 


orfl 


Cytochrome P450tyll (Streptomyces 
fradiae) 


S49051 


530 


Cytochrome 
P450 


or/2 


ORF 1 5x4 (Listonella anguillarum) 


AAB81630 


113 


Inconnue 




aiiiinuircinsierase-iiKe protein 
(Streptomyces antibioticus) 




431 


Amino- 
transferase 


orf4 


alpha-D -glucose- 1 -phosphate 
thymidylyl transferase (Streptomyces 
venezuelae) 


AAC68682 


404 


alpha-D-glucose- 
1 -phosphate 
thymidylyltransfe 
rase 


orp 


Aprb (streptomyces tenebrarius) 


AAG18457 


476 


dTDP-gfucose 
4,6-deshydratase 


orf6 


Thioesterase (Streptomyces avermitilis) 


BAB69315 


234 


Thioesterase 


orjv 


lylCVI (Streptomyces fradiae) 


AAF29379 


461 


dNTPhexose 
2,3 -deshydratase 


Of JO 


probable aminotransferase 
(Saccharopolyspora spinosa) 


AAG23279 


465 


Aminotransferase 


orjyc 


brmX (streptomyces ambofaciens) 


S25204 


445 


Methyltransferase 


OJ JIU 


krmK (Streptomyces ambojaciens) 


S2^203 


1074 


Proteine de 
regulation 


orfllc 


SnTiiR ( StvPntniywH^fxt rtYnJ~infn rsn v\ 






Resistance a la 
spiramycine 


orfl 2 


UrdQ (Streptomyces fradiae) 


AAF72550 


634 


NDP-hexose 3,4- 
deshydratase 


orfl 3c 


SC4H2.17 (Streptomyces coelicolor) 


T35116 


619 


Inconnue 


or/14 


putative reductase (Streptomyces \ 
coelicolor) 


CAB90862 


147 


Reductase 
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orfl 5 c 


x luuauit ^? ivv/LLJi cuubLaoC' \Olr epiOmyCd 

antibioticus) 


0 Tf i i no 
$ 1 J 1 1 UZ 




3-cetoreductase 


orfl6 




A A AH 1 


. 209 


. NDP.hexose 3,4 
isomerase 


isomerase {Streptomyces fradiae) 






orfl7 


venezuelae) 


A A PiCO tZHH 

AACobo / / 


400 


Glycosyl 
transferase 


nrflR 
Ltrj i o 


Glycosyl transferase {Streptomyces 
rishiriensis) 


AAG29785 


185 


Glycosyl 
transferase 


rwfl Q 

orjiy 


JNUr-nexose 4-cetoreductase TylCIV 
{Streptomyces fradiae) 


AAD41822 


266 


NDP-hexose 4- 
cetoreduetase 


or/20 


EryBII (Saccharopolyspora erythraea) 


AAB84068 


491 


aldoceto 
reductase 


orf21c 


TylCIII {Streptomyces fradiae) 


AAD41823 


669 


NDP-hexose 3-C- 
methyltransferase 


orf22c 


FkbH {Streptomyces hygroscopicus) 


AAF86387 


463 


Implique dans la 
biosynthese du 
methoxymalonyl 


orfISc 


Fkbl {Streptomyces hygros copious) 


AAF86388 


387 


Acyl CoA 
deshydrogenase 


orf24c 


FkbJ {Streptomyces hygroscopicus) 


AAF86389 


87 


Implique dans la 
biosynthese du 
methoxymalonyl 


orf25c 


FkbK {Streptomyces hygroscopicus) 


AAF86390 


268 


Acyl CoA 
deshydrogenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Des experiences deactivation de genes ont ete realisees pour confirmer ces 
resultats. Les methodes utilisees consistent a effectuer un remplacement de gene. Le 
gene cible a interrompre est remplace par une copie de ce gene interrompue par une 
cassette conferant la resistance a un antibiotique (par exemple l'apramycine ou 
l'hygromycine). Les cassettes utilisees sont bordees de part et d 'autre par des codons de 
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terminaison de la traduction dans toutes les phases de lecture et par des terminateurs de 
transcription actifs chez Streptomyces. L'insertion de la cassette dans le gene cible peut 
s'accompagner ou non d'une deletion dans ce gene cible. La taille des regions flanquant 
la cassette peut aller de quelques centaines a plusieurs milliers de paires de bases. Un 
5 deuxieme type de cassettes peut etre utilise pour 1'inactivation de genes : des cassettes 
dites « cassettes excisables » (cf. ci dessus). Les souches ainsi construites ont ete testees 
pour leur production en spiramycines. 

Le gene orfl code une proteine presentant une relative forte similitude avec 
plusieurs cytochrome P450. Notamment, la proteine codee par orfl possede une 

10 similitude importante avec la proteine codee par le gene tyll impliquee dans la 
biosynthese de tylosine chez Streptomyces fradiae (Merson-Davies ? L.A. et al., 1994; 
Numero d'acces GenBank ; S49051 ; Score BLAST: 530). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene orfl code egalement une cytochrome P450. Cette hypothese est 

15 etayee par le fait que la proteine codee par le gene orfl presente une forte similitude 
avec d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 13). 



Tableau 13 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative cytochrome P450 YJIB 
(Bacillus subtilis) 


Q34374 


248 


Cytochrome P450 


Cytochrome P450 113A1 
(Saccharopolyspora erythraea) 


P48635 


237 


Cytochrome P450 


C^ochrome P-450 hydroxylase 
homolog (Streptomyces caelestis) 


AAC46023 


208" 


Cytochrome P-450 
hydroxylase 
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Cytochrome P450 monooxygenase 


AAC64105 


206 


Cytochrome P450 


(Streptomyces venezuelae) 






monooxygenase 











* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene or/2 code une proteine presentant une similitude avec plusieurs proteines 
de fonctions inconnues (cf. Tableau 14). Notamment, la proteine codee par or/2 possede 
une similitude relativement importante avec la proteine codee par le gene ORF15x4 de 
Listonella anguillarum (numero d'acces GenBank : AAB81630 ; Score BLAST : 113) 
de fonction inconnue. 



Tableau 14 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


unknown (Campylobacter jejuni) 


AAK12959 


106 


Inconnue 


WcgF (Bacteroides fragilis) 


AAD56738 


105 


Inconnue 


unknown {Leptospira horgpetersenii) 


AAD 12964 


96 


Inconnue 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et ah, 1 990). 



Le gene orf2 n'ayant pas d'homologue de fonction connue, son inactivation a ete 
realisee. II a pu etre montre que la souche resultante ne produit plus de spiramycines. 
Ceci confirme que le gene or/2 est bien implique dans la bios>Tithese des spiramycines. 
La proteine codee par ce gene regule ou est responsable d'une etape de byconversion 
essentielle a la biosynthese des spiramycines. 
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Le gene or/3 code une proteine presentant une relative forte similitude avec 
plusieurs aminotransferases. Notamment, la proteine codee par or/3 possede une 
similitude importante avec une aminotransferase de Streptomyces antibioticus impliquee 
dans la biosynthese de Poleandomycine (Draeger 5 G., et al, 1999; Numero d'acces 
5 GenBank: AAF59939 ; Score BLAST: 431). Cette similitude avec une proteine 
impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere fortement 
que le gene or/3 code une 3 amino-transferase responsable de la reaction de 
transamination necessaire a la biosynthese du mycaminose (cf figure 5). Cette 
hypothese est etayee par le fait que la proteine codec par le gene or/3 presente une forte 
10 similitude avec d'autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 15). 



Tableau 15 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Aminotransferase (Streptomyces 
antibioticus) 


T51111 


429 


Aminotransferase 


Transaminase (Streptomyces 
venezuelae) 


AAC68680 


419 


Transaminase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



15 L'inactivation du gene or/3 a ete realisee. II a ainsi pu etre montre que la souche 

resultante ne produit plus de spiramycines. Ceci confirme que le gene or/3 est bien 
implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de byconversion essentielle a la biosynthese des 
spiramycines. 
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Le gene or/4 code une proteine presentant une relative forte similitude avec 
phisieurs NDP-glucose synthetases. Notamment, la proteine codee par or/4 possede une 
similitude importante avec une alpha-D-glucose- 1 -phosphate thymidylyltransferase ..de 
Streptomyces venezuelae (Xue Y et a/., 1998 ; Numero d'acces GenBank : AAC68682 ; 
Score BLAST 404). Cette similitude avec une proteine impliquee dans la voie de 
biosynthese d'un autre antibiotique proche suggere fortement que le gene or/4 code une 
NDP-glucose syntethase responsable de la synthese du NDP-glucose necessaire a la 
biosynthese des trois sucres atypiques incorpores dans ia molecule de spiramycine (cf. 
figure 4, 5 et 6). Cette hypothese est etayee par le fait que la proteine codee par le gene 
or/4 presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 16). 



Tableau 16 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glucose- 1 -phosphate 
thymidyltransferase (Streptomyces 
avermitilis) 


BAA84594 


402 


Glucose- 1 -phosphate 
thymidyltransferase 


Acl Y {Streptomyces galilaeus) 


BAB72036 


400 


dTDP-1 -glucose 
synthetase 


Putative glucose- 1 -phosphate 
thymidyltransferase 
(Saccharopolyspora spinosa) 


AAJC83289 


399 


glucose- 1 -phosphate 
thymidyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Le gene orp code une proteine presentant une relative forte similitude avec 
plusieurs glucose dehydratases. Notamment, la proteine codee par or/5 possede une 
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similitude impoitante avec une dTDP-glucose 4,6-deshydratase de Streptomyces 
tenebrarius (Li 3 T.B. et al.,2Q0l ; Numero d'acces GenBank: AAG18457. Score 
BLAST : 476). Cette similitude avec une proteine impliquee dans la voie de biosynthese 
d'un autre antibiotique proche suggere fortement que le gene or/5 code line NDP 
glucose dehydratase necessaire a la biosynthese des trois sucres atypiques incorpores 
dans la molecule de spiramycine (cf. figure 4, 5 et 6). Cette hypothese est etayee par le 
fait que la proteine codee par le gene or/5 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 1 7). 



Tableau 17 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


DTDP-glucose 4 ? 6-deshydratase 
{Saccharopolyspora spinosa) 


AAK83290 


464 


DTDP-glucose 4,6- 
deshydratase 


thymidine diphosphoglucose 4,6- 
deshydratase {Saccharopolyspora 
eiythraed) 


AAA68211 


445 


thymidine r 

diphosphoglucose 

4,6-deshydratase 


dTDPglucose 4,6-deshydratase (EC 
4.2. 1 .46) - {Streptomyces fradiae) 


S49054 


443 


dTDPglucose 4,6- 
deshydratase 


TDP-glucose-4 ? 6-deshydratase 
{Streptomyces venezuelae) 


AAC68681 


421 


TDP-glucose-4,6- 
deshydratase 


SgcA {Streptomyces globisporus) 


AAF 13 998 


418 


dNDP-glucose-4,6- 
deshydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1990). 
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Le gene or/6 code une proteine presentant une relative forte similitude avec 
plusieurs thioesterases. Notaniment la proteme codee par or/6 possede une similitude 
importante avec une thioesterase de Streptomyces avermitilis (Omura,S. et al., 2001 ; 
Numero d'acces GenBank : BAB69315 ; Score BLAST : 234). Cette similitude avec une 
proteine impliquee dans la voie de biosynthese d'un autre antibiotique proche suggere 
fortement que le gene orftS code egalement une thioesterase. Cette hypothese est etayee 
par le fait que la proteine codee par le gene or/6 presente une forte similitude avec 
d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 18). 

Tableau 18 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


RifR (Amycolatopsis mediterranei) 


AAG52991 


216 


Thioesterase ■ 


Thioesterase - {Streptomyces fradiae) 


S49055 


215 


Thioesterase 


Thioesterase {Streptomyces 
avermitilis) 


BAB69188 


213 


Thioesterase 


Thioesterase II (EC 3. 1 .2.-) - 
{Streptomyces venezuelae) 


T17413 


203 


Thioesterase 


Piml protein {Streptomyces natalensis) 


CAC20922 


201 


Thioesterase 


Thioesterase {Streptomyces griseus) 


CAC22116 


200 


Thioesterase 



* une plus grande similitude de sequence est associee a un score BLAST plu 
eleve (Altschul et al, 1 990). 



us 



Le gene orp code une proteine presentant une relative forte similitude avec 
plusieurs hexose dehydratases. Notamment, la proteine codee par or/6 possede une 
similitude importante avec une dNTP hexose 2,3 -dehydratase (codee par le gi 



irene 
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TylCVI) de Streptomyces fradiae impliquee clans la bios5>nthese de ia tylosine (Merson- 
Davies,L.A. et al, 1994 ; Numero d'acces GenBank : AAF29379 ; Score- BLAST : 461). 
Cette similitude avec une proteine impliquee dans la voie de biosynthese d 5 un autre 
antibiotique proche suggere fortement que le gene orf7 code egalement une hexose 2-3 
deshydratase necessaire a la biosynthese de deux sucres atypiques incorpores dans la 
molecule de spiramycine (cf. figure 4 et 6). Cette hypothese est etayee par le fait que la 
proteine codec par le gene or/7 presente une forte, similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 19). 



Tableau 19 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Rifl 8 (Amycolatopsis mediterranei) 


AAG52988 


459 


Hexose - £ 
deshydratase 


SimB3 {Streptomyces antibioticus) 


AAK06810 


444 


dNDP-4-keto-6- 

deox3^glucose-2 5 3- 

deshydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1 990). 



Le gene orf8 code une proteine presentant une relative forte similitude avec 
plusieurs aminotransferases. Notamment, la proteine codee par or/8 possede une 
similitude importante avec une aminotransferase probablement impliquee dans la 
biosynthese de la forosamine chez Saccharopolyspora spinosa (Waldron,C. et ai. 2001 ; 
Numero d'acces GenBank : AAG23279 ; score BLAST : 465). Cette similitude avec une 
proteine impliquee dans la voie de bios5>nthese d ? un autre antibiotique proche suggere 
fortement que le gene orfS code une 4 amino-transferase responsable de la reaction de 
transamination necessaire a la biosynthese de la forosamine (cf figure 6). Cette 
hj^pothese est etayee par le fait que la proteine codee par le gene or/8 presente une forte 
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similitude avec d''autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 20). 



Tableau 20 



Proteine presentant une similitude 
significative 


Numer 
o (Faeces 
GenBank 


Score 
BLAST* 


Fonction 
rapportee 


Putative ammo-sugar biosynthesis 
protein (Bordetella bronchiseptica) 


CAA07666 


213 


Proteine impliquee 
dans la biosynthese 
d'amino-sucre 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 

L'inactivation du gene or/8 a ete realisee. H a pu ainsi etre montre que la souche 
resultante ne produit plus de spiramycines. Ceci confirme que le gene or/8 est bien 
implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est done 
bien responsable d'une etape de bioconversion essentielle k la biosynthese des 
spiramycines. 

Le gene orf9c a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmA'par Geistlich et al. (Geistlich,M., et al, 1992). La similitude de la proteine codee 
par ce gene avec plusieurs methyltransferases impliquees dans la voie de biosynthese 
d'autres antibiotiques proches suggere fortement que le gene or9c code une methyl- 
transferase responsable de la reaction de methylation necessaire a la biosynthese du 
mycaminose ou de la forosamine (cf. figure 5 et 6). Cette hypothese est etayee par le fait 
que la proteine codee par le gene orftc presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 21). 
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Tableau 21 



Proteine presentant une similitude 
si oni fi cati v s 


Numero 
GenBank 


Score 
BT AST* 


Fonciion rapportee 


N,N-dimetliyltransferase 
{Streptomyces venezuelae) 


AAC6S67S 


240 


N,N- 

dimethyltransferase 


Methyltransferase (Streptomyces 
antibioticus) 


CAA05643 


232 


Methyltransferase 


Putative amino methylase 
(Streptomyces nogalater) 


AAF01819 


219 


Aminomethylase 



* une plus grande similitude de sequence est associee a un score BLAST plus; 
eleve (Altschul et ah, 1990). .. . 



Le gene orflO a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmR par Geistlich et ah (Geistlich ? M. ? et ah, 1992). La proteine codee par ce gene est 
impliquee dans la regulation de la voie de biosynthese des spiramycines chez 
Streptomyces ambofaciens. L'inactivation du gene orflO a ete realisee. II a pu ainsi etre. 
montre que la souche resultante ne produit plus de spiramycines. Ceci confirme que le 
gene orfl 0 est bien implique dans la biosynthese des spiramycines. La proteine codee 
par ce gene est done bien essentielle a la biosynthese des spiramycines. 

Le gene orfl 1c a deja ete identifie chez Streptomyces ambofaciens et a ete designe 
srmB par Geistlich et ah (Geistlich 5 M. et ah, 1992) et Schoner et ah (Schoner B et. ah, 
1992). La proteine codee par ce gene est impliquee dans la resistance a la spiramycine 
chez Streptomyces ambofaciens et est un transporteur de type ABC. 

Le gene orf!2 code une proteine presentant une relative forte similitude avec 
plusieurs hexose dehydratases. Notamment, la proteine codee par orfl2 possede une 
similitude importante avec une NDP-hexose 3.4-deshydratase codee par le gene UrdO 
de Streptomyces fradiae et impliquee dans la bios3*ith6se de la tylosine (Hor£neister,D. 
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et al, 2000 : Numero d'acees GenBank : AAF72550 ; Score BLAST : 634). Cette 
similitude avec une proteine impliquee dans la voie de biosynthese d'un autre 
antibiotique proche suggere fortement que le gene or/12 code une 3.4 dehydratase 
responsable de la reaction de deshydratation necessaire a la biosynthese de la forosamine 
(cf. figure 6). Cette hypothese est etayee par le fait que la proteine codee par le gene 
orfll presente une forte similitude avec d'autres proteines de fonction similaire chez 
d'autres organismes (cf. tableau 22). 



Tableau 22 



Proteine presentant une similitude 
significative 


; Numero 
u acces 
GenBank 


Score 

DT AO T^sk 


Fonction rapportee 


AknP {Streptomyces galilaeus) 


AAF73452 


625 


3 -deshydratase 


NDP-hexose 3 ? 4-dehydratase homolog 
{Streptomyces cy>anogenus) 


AAD13547 


624 


NDP-hexose 3,4- 
deshydratase 


Rdml {Streptomyces purpurascens) 


AA.L24451 


608 


hexose-C-3- 
deshydratase 


Probable CDP-4-keto-6-deox3'glucose- 
3 -dehydratase (El) {Streptomyces 
violaceoruber} 


T46528 


602 


CDP-4-ceto-6- 

deoxyglucose-3- 

deshydratase 


Prob abl e NDP -hexose-3 ,4~dehydratase 
{Saccharopolyspora spinosa) 


AAG23278 


582 


NDP-hexose-3,4- 
deshydratase 


dNTP-hexose deshydratase 
{Amycolatopsis mediterranei) 


A4C01730 


576 


dNTP-hexose 
deshydratase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 
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L'inactivation du gene orfl2 a ete realisee. II a pu etre montre que la souche 
resultaute ne produit plus de spiramycines. Ceci confirme que le gene orfl2 est bien 
implique dans la biosynthese de la spiramycine. L'enzyme codee par ce gene est done 
bien responsable d ; une etape de bioconversion essentielle a la biosynthese de la 
spiramycine. 

Le gene or/13c code une proteine presentant une relative forte similitude avec une 
proteine de fonction inconnue chez Streptomyces coelicolor, Cette proteine a ete 
nominee SC4H2.17 (numero d'acces Gene3ank : T35116; Score BLAST: 619). La 
proteine codec par le gene orfl3c presente egalement une forte similitude avec d'autres 
proteines d'autres organismes (cf. tableau 23). 



Tableau 23 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


hflX protein {Mycobacterium leprae) 


S72938 


473 


Inconnue 


Possible ATP/GTP -binding protein 
{Mycobacterium leprae) 


NP_301739 


470 


Proteine fixant 
T ATP/GTP 


GTP -binding protein {Mycobacterium 
tuberculosis CDC1551) 


AAK47114 


468 


Proteine fixant le 
GTP 


ATP/GTP-binding protein 
{Streptomyces fradiae) 


T44592 


388 


Proteine fixant 
1' ATP/GTP 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 



Aucune fonction precise n'a ete assignee aux proteines proches de celle codee 
par orflSc. L'inactivation du gene orflSc a ete realisee dans le but d'etudier la fonction 
de ce gene dans la voie de biosi'nthese des spiramycinss chez Streptomyces 
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ambofaciens. II a pu etre montre que la souche resultante produit des spiramycins. Ceci 
indique que le gene orflSc n'est pas essentiel a la biosynthese des spiramycines et qu'il 
n 'est pas essentiel a la survie de la bacterie. L'enzyme codee par ce gene n'est done pas 
responsable d'une etape de bioconversion essentielle a la biosynthese des spiramycines. 

5 Le gene or/74 code une proteine presentant une relative forte similitude avec une 

reductase putative (Redenbach,M., et al, 1996 ; numero d'acces GenBank : CAB90862 ; 
Score BLAST : 147). Une analyse des sequences proches obtenues grace au programme 
BLAST par le programme COG (cf. ci-dessus) suggere fortement que le gene orfl4 code 
une 5 epimerase responsable de la reaction d'epimerisation necessaire a la biosynthese 

) du mycarose (cf. figure 4). 

L'inactivation du gene or/74 a ete realisee. II a pu ainsi etre montre que la 
souche resultante ne produit plus de spiramycines. Ceci confirme que le gene or/74 est 
bien implique dans la biosynthese des spiramycines. L'enzyme codee par ce gene est 
done bien responsable d'une etape de bioconversion essentielle a la biosynthese des 
spiramycines. 

Le gene orflSc code une proteine presentant une relative forte similitude avec 
plusieurs cetoreductases. Notamment, la proteine codee par orflSc possede une 
similitude importante avec une 3-cetoreductase chez Streptomyces antibioticus (Numero 
d'acces GenBak : T51 102, Score BLAST : 285). Cette similitude suggere fortement que 
le gene orflSc code une 3 ceto-reductase responsable de la reaction de reduction 
necessaire a la biosynthese de la forosamine (cf. figure 6). Cette hynothese est etayee par 
le fait que la proteine codee par le gene orflSc presente une forte similitude avec 
d'autres proteines de fonction similaire chez d'autres organismes (cf. tableau 24). 



f 
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Tableau 24 



Proteine presentant une similitude 
s i °rn fi caff ve 


Numero 

Li d^OCo 

GenBank 


Score 

RT ACT* 


Fonction rapportee 


oxidoreductase homolog (Streptomyces 
cyanogenus) 


AAD 13550 


272 


Oxidoreductase 


D-oliose 4-cetoreductase 
{Streptomyces argillaceus) 


CAB 965 50 


265 


D-oliose 4- 
cetoreductase 


xAJoiQ {Streptomyces galilaeus) 


AAF73453 


263 


putative 3- 
cetoreductase 


Prob able NDP -hexose- 3 -ketoreductase 
{Saccharopolyspora spinosa) 


AAG23275 


253 


NDP-hexose-3- 

• i. 

cetoreductase. 



* une plus grande similitude de sequence est associee a un score BLAST'plus 
el eve (Altschul et aL 9 1990). 



Le gene orfl6 code une proteine presentant une relative forte similitude avec 
5 plusieurs isom erases. Notamment, la proteine codee par or/16 possede une similitude 
importante avec une NDP hexose 3.4 isomerase chez Streptomyces fradiae (Gandecha et 
al., 1997 ; Numero d'acces GenBak : CAA5747L Score BLAST : 209). Cette similitude 
suggere fortement que le gene orfl6 code une NDP hexose 3,4 isomerase responsable de 
la reaction d'isomerisation necessaire a la biosynthese du mycarose (cf. figure 5). Cette 
. 10 hypothese est etayee par le fait que la proteine codee par le gene or/16 presente une forte 
similitude avec d'autres proteines de fonction similaire chez d'autres organismes (cf. 
tableau 25). 



1er depot 



51 



Tableau 25 



Proteine presentant une similitude 
..significative .. . ...... 


Numero 
d'acces — 
GenBank 


Score 
BLAST* 


Fonction rapportee 


Putative tautomerase (Streptomyces 
venezuelae) 


AAC68676 


145 


Tautomerase 


TDP-4-ceto-6-deoxyhexose 3,4- 
isomerase (Micromonospora 
megalomicea subsp. nigra) 


AAG13907 


112 


TDP-4-ceto-6- 
deoxyhexose 3,4- 
isomerase 



une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al, 1990). 

Le gene orfl7 code une proteine presentant une relative forte similitude avec 
plusieurs glycosyl transferases. Notamment, la proteine codee par orfl7 possede une 
similitude importante avec une glycosyl transferase de Streptomyces venezuelae (Xue,Y. 
et al, 1998; Numero d'acces GenBank: AAC68677 ; score BLAST: 400). La 
similitude de la proteine codee par le gene orfl7 avec plusieUrs glycosyl transferases 
impliquees dans la voie de biosynthese d'autres antibiotiques proches suggere fortement 
que ce gene code egalement une glycosyl transferase. Cette hypothese est etayee par le 
fait que la proteine codee par le gene or/1 7 presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf. tableau 26). 

Tableau 26 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Glycosyltransferase (Streptomyces 
fradiae) 


CAA57472 


399 


Glycosyltransferase 
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Glycosyltransferase {Streptomyces 
antibioticus) 


CAA05642 


378 


Gl yco syltr ansf erase 


Glycosyltransferase {Streptomyces . 
antibioticus) 


CAA05641 


360 


Glycosyltransferase 


Glycosyltransferase 
{Saccharopolyspora erythraea) 


CAA74710 


344 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al> 1990). 



Le gene orflS code une proteine pr6sentant une relative forte similitude avec 
plusieurs glycosyl transferases. Notamment, la proteine codee par orfl8 possede une 
similitude importante avec une glycosyl transferase de Streptomyces rishiriensis (Wang 
et a/.,2000; Numero d^acces GenBank : AAG29785 ; score BLAST: 185). La 
similitude de la proteine codee par le gene or/18 avec plusieurs glycosyl transferases 
impliquees dans la voie de biosynthese d'autres antibiotiques proches suggere fortement 
que ce gene code egalement une glycosyl transferase. Cette hypothese est etayee par le 
fait que la proteine codee par le gene orflS presente une forte similitude avec d'autres 
proteines de fonction similaire chez d'autres organismes (cf tableau 27). 



Tableau 27 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


NovM {Streptomyces spheroides) 


AAF67506 


184 


Gly co syltr an sf eras e 


probable gtycosyl transferase 
{Streptomyces violaceoruber) 


T46519 


169 


Glycosyltransferase 
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Glycosy] transferase homolog 
{Streptomyces cyanogenas) 


AAD 13553 


167 


Glycosyltransferase 


Glycosy! transferase homolog 
{Streptomyces cyanogenus) 


AAD13555 


163 


Glycosyltransferase 


dNTP-hexose glycosyl transferase 

(Amycolatopsis mediterranei) 



AA CO 1731 


160 


Glycosyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST pi 
eleve (Altschul et al., 1990). . . 



Le gene orfl9 code une proteine presentant une relative forte similitude avec 
plusieurs cetoreductases. Notamment, la proteine codee par or/79 possede une similitude 
importante avec une NDP-hexose 4-cetoreductase (TylCIV) de Streptomyces fradiae 
(Bate et al, 2000 ; Numero d'acces GenBank : AAD41822 ; score BLAST : 266). La 
similitude de la proteine codee par le gene orf!9 avec cette cetoreductase impliquee dans 
la voie de bios}'nthese d'un antibiotique proche suggere fortement que ce gene code 
egalement une 4-cetoreductase responsable de la reaction de reduction necessaire a la 
biosynthese du mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la 
proteine codee par le gene or/19 presente une forte similitude avec d'autres proteines de 
fonction similaire chez d'autres organismes (cf. tableau 28). 



Tableau 28 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


NDP-4-ceto-6-deoxyhexose 4- 
cetoreductase {Streptomyces venezuelae) 


AAL14256 

i 


251 


NDP-4-ceto-6- 
deoxyhexose 4- 
cetoreductase 
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EryRIV {Saccharopolyspora erythraed) 


AAB84071 


249 


oxidoreductase 


TDP-4-ceto-6-deo?:yhexose 4- 
cetoreductase {Micromonospora 
megalomicea subsp. Nigra) 


AAG13916 


218 


TDP-4-ceto-6- 
deoxyhexose 4- 
cetoreductase 


dTDP-4-ceto-6-deox3'-L-hexose 4- 
reductase (Streptomyces avermitilis) 


BAA84595 


212 


dTDP-4-ceto-6- 
deoxy-L-hexose 4- 
reductase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et al 9 1990). 



Le gene or/20 code une proteine presentant une relative forte similitude avec 
plusieurs hexose reductases. Notamment, la proteine codee par or/20 possede' une 
similitude importante avec le gene EryBII de Saccharopolyspora erythraea qui code* une 
dTDP-4-ceto-L-6-deoxy-hexose 2 5 3-reductase (Sunimers ? R.G. ? et al t \991\ Nuihero 
d'acces GenBank : AAB84068 ; Score BLAST : 491). La similitude de la proteine codee 
pax le gene or/20 avec plusieurs hexose reductases impliquees dans la voie de 
biosynthese d'autres antibiotiques proches suggere fortement que ce gene code une 2-3 
reductase responsable de la reaction de reduction necessaire a la biosjoithese du 
mycarose (cf. figure 4). Cette hypothese est etayee par le fait que la proteine codee par le 
gene or/20 presente une forte similitude avec d'autres proteines de fonction similaire 
chez d'autres organismes (cf. tableau 29). 



Tableau 29 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Tj'l CII (Streptomyces fradiae) 


AAD41821 


464 


NDP -hexose 23- 
enos^l reductase 
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TDP-4-ceto-6-deoxyhexose 2,3- 
reductase (Micromonospora 
megalomicea subsp. Nipra) 


AAG13914 


446 


dTDP-4-ceto-6-deoxy-L-hexose 2,3- 
reductase (Streptomyces avermitilis) 


BAA84599 


377 



TDP-4-ceto-6- 
deoxyhexose 2 
reductase ~ 



dTDP-4-ceto-6- 
deoxj'-L-hexose 
2,3 -reductase 



eleve (Altschul et al, 1 990). 

Le gene or/2 J c code une proteine presentant une relative forte similitude avec 
plusieurs hexose methyltransferases. Notamment la proteine codee par orfllc possede 
une similitude importante avec le gene TylCIII de Streptomyces fradiae qui code une 
NDP-hexose 3-C-methyltransferase (Bate,N et aL, 2000 ; Numero d'acces GenBank : 
-AAD41823 ; Score BLAST : 669). La similitude de la proteine codee par le gene orfllc 
avec plusieurs hexose methyltransferases impliquees dans la vole de biosynthese 
d'autres antibiotiques proches suggere fortement que ce gene code une hexose 
methyltransferase responsable de la reaction de methylation necessaire a la biosynthese 
du mycarose (cf. figure 4). Cette h 5T othese est etayee par le fait que la proteine codee 
par le gene orfllc presente une forte similitude avec d'autres protemes de fonction 
similaire chez d'autres organismes (cf. tableau 30). 

Tableau 30 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


eryH (Saccharopolyspora eiythraea) 


228448 


592 


_ 

Gene de 
biosynthese de 
Ferythromycine 
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S-adenosyl-dependent rneth}'! 
transferase (Coziella burnetii) 


AAK71270 


358 


Methyltransferase 


NovU (Streptomyces spheroides) 


AAF675I4 


184 


C~methyltransferase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschu! et aL, 1990). 



Le gene orf22c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbH de Streptomyces hygroscopicus var. as corny ceticus qui 
5 code une enzyme impliquee dans la biosynthese du methoxj'malonyl (Wu,K. et 
a/., 2000 ; Numero d'acces GenBank : AAF86387 ; Score BLAST : 463). La similitude 
de la proteine codee par le gene orf22c avec cette proteine impliquee dans la voie de 
biosynthese d'un autre macrolide proche suggere fortement que ce gene code egalement 
une enzyme impliquee dans la biosynthese du methoxymalonyl chez Streptomyces 
10 ambofaciens (cf. figure 8). 

*f 

Le gene orf23c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene flzbl de Streptomyces hygroscopicus var. ascomyceticus qui 
code une acyl Co A dehydrogenase impliquee dans la biosynthese du methoxymalonyl 
(Wu,K. et aL, 2000 ; Numero d'acces GenBank : AAF86388 : Score BLAST 387). La 
15 similitude de la proteine codee par le gene orfi.Sc avec plusieurs acyl CoA 
dehydrogenases impliquees dans la voie de biosynthese d'autres antibiotiques proches 
suggere fortement que ce gene code 1 une acyl CoA dehydrogenase impliquee dans la 
biosynthese du methoxymalonj'l (cf. figure 8). Cette hypo these est etayee par le fait que 
la proteine codee par le gene orfiSc presente une forte similitude avec d'autres proteines 
• 20 de fonction similaire chez d'autres organismes (cf. tableau 3 1). 
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Tableau 3 1 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapport ee 


Acyl-CoA deshydrogenase 
(Polyangium. cellulosum) 


AAK 19892 


171 


Acyl-CoA 
deshydrogenase 


Probable acyl-CoA dehydrogenase - 
(Streptomyces coelicolor) 


T36802 


160 


acyl-CoA 
deshydrogenase 



* une plus grande similitude de sequence est associee a un score BLAST plus 
eleve (Altschul et aL, 1990). 



Le gene orf24c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene JkbJ de Streptomyces hygroscopicus var. ascomyceticus qui 
coderait la proteine de liaison du groupement acyl (Acyl Carrier Protein (A CP)) 
impliquee dans la biosynthese du methoxymalonyl (Wu,K., et aL 9 2000 ; Numero 
d'acces GenBank : AAF86389 : Score BLAST : 87). La similitude de la proteine codee 
par le gene orf24c avec cette proteine impliquees dans la voie de biosynthese d ? un autre 
macrolide proche suggere fortement que ce gene code une proteine impliquee dans la 
biosynthese du methoxymalonyl chez Streptomyces ambofaciens (of. figure 8). 

Le gene orf25c code une proteine presentant une relative forte similitude avec la 
proteine codee par le gene fkbK de Streptomyces hygroscopicus var. ascomyceticus qui 
code une acyl CoA deshydrogenase impliquee dans la biosynthese du methoxymalonyl 
(Wu ? K. s et al, 2000 ; Numero d'acces GenBank : AAF86390 ; score BLAST : 268). La 
similitude de la proteine codee par le gene orf25c avec plusieurs acyl CoA 
dehydrogenases impliquees dans la voie de biosynthese d ; autres aatibiotiques proches 
suggere fortement que ce gene code une acyl CoA deshydrogenase impliquee dans la 
biosynthese du mdthoxymalonyl (cf. figure 8). Cette hypothese est etayee par le fait que 



1* 
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la proteine codee par le gene or/2 5c presente une forte similitude avec d'autres proteines 
de fonction similaire chez d'autres organismes (cf. tableau 32). 



Tableau 32 



Proteine presentant une similitude 
significative 


Numero 

d'acces 

GenBank 


Score 
BLAST* 


Fonction rapportee 


Probable 3-Hydroxybutyryl-CoA 
Dehydrogenase (Bacillus subtilis) 


P45856 


177 


3 -Hydroxybutyryl- 
CoA dehydrogenase 


S-hydroxybutyryl-CoA dehydrogenase 
protein (Bacillus thuringiensis serovar 
kurstakt) 


AAL32270 


174 


3 -hydroxybutyryl- 
CoA dehydrogenase 


3-hydroxybutyryl-CoA dehydrogenase 
(Deinococcus radiodurans) 


NP_294792 


167 


3 -hydro xybutyryl- 
CoA dehydrogenase 



* une plus grande similitude de sequence est associee a un score BLAST, plus 
5 el eve (Altschul et ah, 1 990). 



La presente invention a egalement pour objet des polynucleotides s'hybridant dans 
des conditions d 'hybridation de forte stringence a au moins Tun des polynucleotides de 
sequence SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19,21,23,25, 28,30, 34, 36, 40, 43,45, 
47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou Tun de ses variants ou ■ 

10 Tune des sequences derivees de celles-ci en raison de la degenerescence du code 
genetique. Preferentiellement, cesdit polynucleotides sont isoles a partir d'une bacterie 
du genre Streptomyces, plus preferentiellement, ces potynucleo tides codent des 
proteines impliquees dans la biosynthese d ; un macrolide et encore plus 
preferentiellement, ces polynucleotides codent une proteine ayant une activite similaire 

15 a la proteine codee par les polynucleotides avec lesquels ils s'hybrident. Les conditions 
d'hybridation de forte stringence peuvent etre defini.es comme des conditions ■ 
d 'hybridation defavorisant Fhybridation de brins d'acides nucleiques non homologues. : 
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20 



15 



) 



Des conditions d'hybridations de forte stringence peuvent etre par exemple decrites 
comme des conditions d'hybridation dans le tampon decrit par Church & Gilbert 
(Church & Gilbert, 1984) a une temperature comprise entre 55°C et 65 °C, de maniere. 
preferee la temperature d'hyridation est de 55°C, de maniere encore plus preferee la 
temperatue d'hybridation est de 60°C et de maniere tout a fait preferee la temperature 
d'hybridation est de 65°C, suivi d'un ou plusieurs lavages effectue en tampon 2X SSC a 
une temperature comprise entre 55°C et 65°C, de maniere preferee cette temperature est 
de 55°C, de maniere encore plus preferee cette temperatue est de 60°C et de maniere 
tout a fait preferee cette temperature est de 65°C, suivi d'un ou plusieurs lavages en 
tampon 0.5X SSC a une temperature comprise entre 55°C et 65°C, de maniere preferee 
cette temperature est de 55°C, de maniere encore plus preferee cette temperatue est de 
60°C et de maniere tout a fait preferee cette temperature est de 65°C. Les conditions 
d'hybridation ci-dessus decrites peuvent etre adaptees en fonction de la longueur de 
1'acide nucleique dont 1 'hybridation est recherchee ou du type de marquage choisi, 
selon des techniques connues de l'homme du metier. Les conditions convenables 
d'hybridation peuvent par exemple etre adaptees selon l'ouvrage de F.Ausubel et al., 
2002. 

L'invention conceme egalement un polynucleotide ayant au moms 70%, de facon 
plus preferee 80%, de facon plus preferee 85%, de facon encore plus preferee 90%, de 
facon encore plus preferee 95% et de maniere tout a fait preferee 98% d'identite en 
nucleotides avec un polynucleotide comprenant au moins 10, 12, 15, 18, 20 a 25, 30. 
40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 
750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 3250, 1300, 1350, 1400, 1450, - 
1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 nucleotides consecutifs d'un 
polynucleotide choisi dans le groupe eonstitue des sequences nucleotidiques SEQ ID N° 
3, 5, 7, 9, 1 1, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 
66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou i'un de ses variants ou l'une des sequences 
derivees de celles-ci en raison de la degenerescence du code genetique, ou un 
polynucleotide de sequence complementaire. Preferentieilement, ces dits 
polynucleotides sont isoles a partir d'une bacterie du genre Streptomyces, plus 
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preferenti el 1 era ent, ces pol 311110] eo tides codent des proteines impliquees dans la 
biosynthese d'un macrolide et encore plus preferentiellement, ces polynucleotides 
codent des proteines ayant des activites similaires aux proteines codees par les 
polynucleotides avec lesquels ils presentent Pidentite. De facon tout a fait preferee, un 
5 poljmucleotide selon Pinvention est choisi dans le groupe constitue des sequences 
nucleotidiques SEQ ID N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 
43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou un 
polynucleotide de sequence complementaire. 

L'alignement optimal des sequences pour la comparaison peut etre realise de 
10 maniere informatique a Paide d'algorithmes connus, par exemple ceux du package 
FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France. A titre 
d' illustration, le pourcentage d'identite de sequence pourra etre determine a Paide dii 
logiciel LFASTA (Chao K.-M. et aL, 1992) ou LALIGN (Huang X. et Miller W.," 
15 1991). Les programmes LFASTA et LALIGN font partie du package FASTA. LALIGN < : 
retourne les alignements locaux optimaux : ce programme est plus rigoureux, mais aussi 
plus lent que LFASTA. 

Un autre aspect de Pinvention concerne un polypeptide resultant de r expression 
d'une sequence d'acide nucleique telle que definie ci-dessus. Preferentiellement, les 

20 polypeptides selon Pinvention presentent au moins 70%, de fa<?on plus preferee 80%, de 
fa$on plus preferee 85%, de fa<?on encore plus preferee 90%, de fa^on encore plus 
preferee 95% et de maniere tout a fait preferee 98% d'identite en acides amines avec un 
polypeptide comprenant au moins 10, 15, 20, 30 a 40, 50, 60, 70, 80, 90,100, 120, 140, 
160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 

25 500, 520, 540, 560, 580, 600, 620 ou 640 acides amines consecutifs d'un polypeptide 
choisi parmi SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 
37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, . 
73, 75, 77, 79 ; 81, 83 et 85 ou Pune de ces sequences excepte que tout au long de ladite 
sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes sans en 
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affecter les proprietes fonctionnelles ou Fun des variant de ces sequences. 
Preferentiellement les polypeptides selon 1'invention sont exprimes a 1'etat naturel par 
une bacterie du genre Streptomyces, plus preferentiellement., ces polypeptides sont 
impliquees dans la bios3'nthese d'un macrolide et encore plus preferentiellement, ces 
polypeptides ont une activite similaire a celle du polypeptide avec lequel il partage 
l'identite. De facon preferee, un polypeptide selon 1'invention est choisi dans le groupe 
constitue des sequences polypeptidiques SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 
24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 
58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83 et 85 ou 1'une de ces sequences 
excepte que tout au long de ladite sequence un ou plusieurs acides amines ont ete 
substitues, inseres ou deletes sans en affecter les proprietes' fonctionnelles ou 1'un des 
variant de ces sequences. De facon tout a fait preferee, un polypeptide selon 1'invention 
est choisi dans le groupe constitue des sequences pol}peptidiques SEQ ID N° 4, 6, 8, 
10, 12, 14, 16, 18, 20, 22, 24, 26, 27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 
50, 51, 52, 54, 55, 56, 57, 58, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83 et 85. 

L'ahgnement optimal des sequences pour la comparaison peut etre realise de 
maniere informatique a 1'aide d'algorithmes connus, par exemple ceux du package. 
FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France. A titre 
d 'illustration, le pourcentage d'identite de sequence pourra etre determine a l'aide du 
logiciel LFASTA (Chao K.-M. et al, 1992) ou L ALIGN (Huang X. et Miller W., 
1991), en utilisant les parametres par defaut tel que defini par le centre de ressources 
INFOBIOGEN, Evry, France. Les programmes LFASTA et LALIGN font partie du 
package FASTA. LALIGN retourne les alignements locaux optimaux : ce programme 
est plus rigoureux, mais aussi plus lent que LFASTA. 

Un autre aspect de 1'invention conceme un ADN recombinant comprenant au 
moins un polynucleotide tel que decrit ci-dessus. Preferentiellement; cet ADN 
recombinant est compris dans un vecteur. Encore plus preferentiellement, le vecteur est 
choisi parmi les bacteriophages, les plasmides, les phagemides, les vecteurs integratifs, 
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les fosmides, les cosmides. les vecteurs navettes, les BAC (Bacterial Artificial 
Chromosome) on les PAC (PI -derived Artificial Chromosome). A titre illustratif on 
peut citer cornme bacteriophages ]e phage lambda et le phage Ml 3. Comme plasmides 
on peut citer les plasmides se repliquant chez E. coli par exemple pBR322 et ses 
derives, pUC18 et ses derives, pUC19 et ses derives. pGB2 et ses derives (Churchward 
G. et al, 1984), pACYC177 (numero d'acces GenBank : X06402) et ses derives, 
pACYC184 (numero d'acces GenBank : X06403) et ses derives. On peut egalement 
citer les plasmides se repliquant chez Streptomyces comme par exemple pi J 101 et ses 
derives, pSG5 et ses derives, SLP1 et ses derives. SCP2* et ses derives (Kieser et al 
2000). Comme phagemides on peut citer a titre illustratif pBluescript II et ses derives 
(commercialises notamment par la societe Stratagene (LaJolla, Californie, USA)), 
pGEM-T et ses derives (commercialise par la societe Promega (Madison, Wisconcin, 
USA.)), aZAPII et ses derives (commercialises notamment par la societe Stratagene 
(LaJolla, Californie, USA)). Comme vecteurs integratifs on peut citer a titre illustratif, 
les vecteurs integratifs chez Streptomyces comme par exemple ceux derives de SLP1 
(Kieser et al, 2000), ceux derives de pSAM2 (Kieser et al, 2000), les vecteurs utilisant 
les systemes d'integration des phages PhiC31 (Kieser et al, 2000) (par exemple 
pSET152 (Bierman et al, 1992)) ou de VWB (Van Mellaert L, et al 1998), ainsi que 
les vecteurs utilisant le systeme d'integration de IS117 (Kieser et al. 2000). Comme 
fosmides on peut citer a titre illustratif le fosmide pFOSl (commercialise par la societe 
New England Bioloabs Inc., Beverly, Massachusetts, USA) et ses derives. Comme 
cosmides on peut citer a titre illustratif le cosmide SuperCos et ses derives 
(commercialises notamment par la societe Stratagene (LaJolla, Californie, USA)), le 
cosmide p\VED15 (Wahl et al, 1987) et ses derives. Comme vecteurs navettes on peut 
citer a titre illustratif les plasmides navettes E, coli I Streptomyces .comme par exemple 
pIJ903 et ses derives, la serie des plasmides pUWL, pCAO106, pWHM3, pOJ446 et 
leurs derives (Kieser et al 2000), les BAC navettes E. coli I Streptomyces comme par 
exemple ceux decrits dans la demande de brevet WO 01/40497. Comme BAC 
(Bacterial Artificial Chromosome) on peut citer a titre illustratif le BAC pBeloBACl 1 
(numero d'acces GenBank :U51 113). Comme PAC (Pi-derived Artificial 
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Chromosome) on peut citer a titre illustratif le vecteur pCYPAC6 (numero d'acces 
GenBank : AF133437). De faeon tout a fait preferee, un vecteur selon Invention est 
choisi parmi pOS49. 1 , pOS49. 11, pOSC49,12, . pOS49. 1.4, pOS49.!6, pO.S49.28, 
pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67, pOS49.88, pOS49.106, 
POS49.120, pOS49.107, pOS49.32, pOS49.43, pOS49.44, pOS49.50, pOS49.99,' 
PSPM17, pSPM21, pSPM502, pSPM504, pSPM507, pSPM508, pSPM509, pSPMl, 
pBXLl 111, pBXLl 1 12, pBXLl 113. 

Un autre aspect de 1 'invention concerne un systeme d' expression comprenant un 
vecteur d'expression approprie et une cellule note permettant I'expression d'un ou 
plusieurs polypeptides tels que decrits ci-dessus dans un systeme bioJogique. Les 
vecteurs d'expression selon 1'invention comprennent une sequence d'acide nucleique 
codant un ou plusieurs polypeptides tels que decrits ci-dessus et peuvent etre destines a 
I'expression des differents polypeptides selon 1'invention dans diverses cellules notes 
bien connues de 1'homme du metier. A titre d'exemple, on peut citer les systemes 
d'expression procaiyote comme les systemes d'expression chez la bacterie E. coli, les 
sytemes d'expression eucaryotes, comme le systeme d'expression baculovirus 
pemiettant une expression dans des cellules d'insectes, les sytemes d'expression 
permettant une expression dans des cellules de levures, les sytemes d'expression 
permettant une expression dans des cellules de mammiferes, notamment des cellules 
humaines. Les vecteurs d'expression utilisables dans de tels systemes sont bien connus 
de 1'homme du metier, en ce qui concerne les cellules procaryotes, on peut citer a titre 
illustratif les vecteurs d'expression chez E. coli par exemple, de la famille pET 
commercialises par la societe Stratagene (LaJoIia, Californie, USA), les vecteurs de la 
famille GATEWAY commercialises par la societe Invitrogen (Carlsbad, Californie, 
USA), les vecteurs de la famille pBAD commercialises par la societe Invitrogen 
(Carlsbad, Californie, USA), les vecteurs de la famille pMAL commercialises par la 
societe New England Bioloabs Inc. (Beverly, Massachusetts, USA), les vecteurs 
d'expression inducibles par le rhamnose cites dans la publication Wilms B et al, 2001 
et leurs derives, on peut egalsment citer les vecteurs d'expression chez Streptomyc.es 
comme par exemple les vecteurs pIJ4123, pIJ602I, pPM927, pANTS49, pANT 850. 
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pANT 851, pANT1200, pANT1201, pANT1202 et leurs derives (Kieser et aL 2000). 
En ce qui concern e les cellules de levures, on peut titer a titre illustratif le vecteur pESC 
commercialise par la societe Stratagene (LaJolla, Califomie, USA). En ce qui conceme 
le sysieme d s expression baculo virus permettant une expression dans des cellules 
d'insectes on peut titer a titre illustratif le vecteur BacPAK6 commercialise par la 
societe BD Biosciences Clontech, (Palo Alto, Californie, USA). En ce qui conceme les 
cellules de mammiferes, on peut citer a titre illustratif des vecteurs comprenant le 
promoteur des genes precoces du virus CMV (Cytomegalovirus) (par exemple le 
vecteur pCMV et ses derives commercialises par la societe Stratagene (LaJolla, 
Californie, USA), ou le promoteur des genes immediats (SV40 early promoter) du virus 
simien vacuolisant SV40 (par exemple le vecteur pSG5 commercialise par la societe 
Stratagene (LaJolla, Californie, USA). 

L'invention est egalement relative a un procede de production d'un polypeptides 
tel que decrit ci-dessus ledit procede comprenant les etapes suivantes: 

a) inserer un acide nuclei que codant ledit polypeptide dans un vecteur approprie* 

•> 

b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transformee ou transfectee avec le vecteur de Tetape a) ; 

c) recuperer le milieu de culture conditionne ou un extrait celiulaire, par 
exemple par sonication ou par choc osmotique ; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir de 
Textrait cellulaire obtenu a Tetape c) 5 ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

Un polypeptide recombinant selon l'invention peut etre purifie par passage sur 
une serie appropriee de colonnes de chromatographie, selon les methodes connues de 
Thomme de Tart et decrites par exemple dans F.Ausubel et al (2002). On peut citer a 
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litre illustratif la technique du « Tag-Histidine », qui consiste a ajouter une courte 
sequence poly-histidine au polypeptide a produire, ce dernier pouvant ensuite etre 
purifie sur colonne de nickel. Un polypeptide selon invention peut etre egalement.- 
prepare par les techniques de s 5 mthese in vitro. A titre illustratif de telles techniques, un 
5 polypeptide selon I' invention pourra etre prepare grace au systeme « rapid translation 
system (RTS)», commercialise notamment par la societe Roche Diagnostics France 
S.A, Meylan, France. 

Un autre aspect de l'invention concerne des cellules hdtes dans laquelle a ete 
introduit au moins un polynucleotide et/ou au moms un ADN recombinant et/ou au 
0 moins un vecteur d'expres.sion selon l'invention. 

Un autre aspect de l'invention concerne des microorganismes bloques dans une 
etape de la voie de biosynthese d'au moins un macrolide. L'interet reside d'une part 
dans fetude de la fonction des proteines mutees et d'autre part dans la realisation de 
microorganismes produisant des intermediaires de biosynthese. Ces intermediaires 
peuvent etre modifies, eventuellement apres separation, soit par ajout de composants 
particuliers dans les milieux de production, soit par introduction dans les 
microorganismes ainsi mutes d'autres genes codant des proteines susceptibles de 
modifier l'intermediaire en s'en servant comme substrat. Ces intermediaires peuvent 
ainsi etre modifies par voie chimique, biochimique, enzymatique et/ou microbiologique. 
Les microorganismes bloques dans une etape de la voie de biosynthese de macrolides 
peuvent etre obtenus en inactivant la fonction d'une ou plusieurs proteines impliquees 
dans la biosynthese de ce ou de ces macrolides dans des microorganismes producteurs 
de ce ou de ces macrolide. Selon la ou les proteines inactivees, on pourra ainsi obtenir 
des microorganismes bloques dans les differentes etapes de la voie de biosynthese de ce 
ou de ces macrolides. L'inactivation de cette ou de ces proteines peut etre effectuee par 
toute methode connue de I'homme du metier, par exemple par mutagenese dans le ou 
les genes codant ladite ou lesdites proteines ou par 1'expression d'un ou de plusieurs 
ARN anti-sens complementaires de I'ARN ou des ARN messagers codant ladite ou 
lesdites proteines. La mutagenese peut, par exemple, etre effectuee ? ar irradiation, par 
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action d*' agent chimique mutagens par mutagenese dirigee. par remplacement de gene 
ou toute autre methode connue de Phomme du metier. Les conditions convenables 
d'une telle mutagenese peuvent par exemple etre adaptees selon Penseignement contenu 
dans les ouvrages de Kieser, T et al (2000) et Ausubel et al. ? (2002). La mutagenese 
peut etre effectuee in vitro ou in situ, par suppression, substitution, deletion et/ou 
addition d'une ou plusieurs bases dans le gene considere ou par inactivation genique. 
Cette mutagenese peut etre effectuee dans un gene comprenant une sequence telle que 
decrite ci-dessus. Preferentiellement, les microorganismes bloques dans une etape de la 
voie de biosynthese de macrolides sont des bacteries du genre Streptomyces . Plus 
preferential ement, P inactivation de la fonction d'une ou plusieurs proteines impliquees 
dans la biosynthese du ou des macrolides en question est effectuee par mutagenese. 
Encore plus preferentiellement, le macrolide en question est la spiramycine et les 
microorganismes dans lesquels sont effectuees la ou les mutageneses sont des souihes 

,x 

'■J ' 

de S. ambofaciens. Plus preferentiellement, la mutagenese est effectuee dans un ou 
plusieurs genes comprenant une des sequences correspondent a une ou plusieurs des 
sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 46, 43, 
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84. De facon preferee, la 
ou les mutageneses sont effectuees par inactivation genique. De facon tout a fait 
preferee, la mutagenese consiste en l'inactivation genique d'un gene comprenant une 
sequence correspondant a la sequence SEQ ID N° 1 3 . 

A titre illustratif. les microorganismes suivants peuvent etre cites a titre d'exemple 
de tels microorganismes : OS49.16 (or/3:: Qhyg, cf. exemple 2), OS49.67 (orfideletion 
en phase, cf. exemple 6), OS49.107 (or/8y. Qhyg, cf. exemple 7), OS49.50 
(or/10:: ffltyg, cf. exemple 8), SPM21 (orf2::att3Qaac-, cf. exemple 10), SPM22 . 
(prf2::att3 deletion en phase, cf. exemple 10), SPM501 (orf6*::attlQhyg J r, cf. exemple 
14), SPM502 (prf6*::at.tl deletion en phase, cf. exemple 14), SPM507 
Xprfl2::att3Qaac-, cf exemple 11), SPM508 (orfl3c::att3Qaac-, cf. exemple 12), 
SPM509 (ovfl4::att3Qaac-, cf. exemple 13). 
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Un autre aspect de 1 'invention conceme un precede de preparation d'un 
intermediaire de biosynthese de macrolide utilisant les microorganismes bloques dans 

consiste a cultiver, dans un milieu de culture approprie, un microorganisme bloque dans 
une etape de la voie de biosynthese de macrolides, tels que decrits ci-dessus, recuperer 
le milieu de culture conditionne ou un extrait cellulaire, par exemple par sonication ou 
par choc osmotique, separer et purifier a partir dudit milieu de culture ou encore a partir 
de l'extrait cellulaire obtenu a 1 'etape precedente, ledit intermediaire de biosynthese. 
Les conditions de culture de tels microorganismes pourront etre determinees selon des 
techniques bien connues de 1'homme du metier. Le milieu de culture pourra par 
exemple etre le milieu MP5 ou le milieu SL11 pour les Streptomyces et notamment 
pour Streptomyces ambofaciens (Pernodet et al., 1993). L'homme du metier pourra 
notamment se referer a 1'ouvrage de Kieser et al. (2000) en ce qui conceme la culture 
des Streptomyces. L'intermediaire produit peut etre recupere par toutes techniques 
connues de l'homme du metier. L'homme du metier pourra se referer, par exemple, aux 
techniques enseignees dans le brevet americain US 3,000,785 et plus particulierement 
aux methodes d' extraction des spiramycines decrites dans ce brevet. 

Un autre objet de l'invention conceme un precede de preparation d'une molecule 
derivee d'un macrolide utilisant les microorganismes bloques dans une etape de la voie 
de biosynthese de ce macrolide, tels que decrits ci-dessus. Le precede consiste a obtenir 
un intermediaire de biosynthese selon le precede ci-dessus et a modifier l'intermediaire 
ainsi produit, eventuellement apres separation du milieu de culture. Les conditions de 
culture de tels microorganismes pourront etre determinees selon des techniques bien 
connues de l'homme du metier. Le milieu de culture pourra par exemple etre le milieu 
MPS ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces 
ambofaciens (Pernodet et al, 1993). L'homme du metier pourra notamment se referer a 
Pouvrage de Kieser et al. 2000 en ce qui conceme la culture des Streptomyces. Les . 
iniermediaires produits peuvent etre modifies, eventuellement apres separation, soit par 
ajout de composants appropries dans les milieux de production, soit par introduction 
dans les microorganismes d'autres genes codant des proteines susceptibles de modifier 
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l'intermediaire en s'en servant comme substrat. Ces intermediaires peuvent ainsi etre 
modifies par voie chimique, biochimique, enzymatique et/ou microbiologique. Plus 
preferentiellement le macrolide en question est la spiramycine et les mi cro organ i smes 
dans lesquels sont effectuees la ou les mutageneses sont des souches de S. ambofaciens. 

L'invention est egalement relative a un microorganisme produisant de la 
spiramycine I mais ne produisant pas de spiramycine II et III. Ce microorganisme 
comprend P ensemble des genes necessaires a la biosynthese de la spiramycine I mais ne 
produit pas de spiramycine n et EI car le gene comprenant la sequence correspondant a 
SEQ ID N° 13 ou 1'un de ses variants ou l'une des sequences derivees de celles-ci en 
raison de la degenerescence du code genetique et codant un polypeptide de sequence 
SEQ ID N° 14 ou Tun de ses variants n'est pas exprime ou a ete rendu inactif. 
L'inactivation de cette proteine peut etre effectuee par toute methode connue de 
l'homme du metier, par exemple par mutagenese dans le gene codant ladite proteine pu 
par {'expression d'un ARN anti-sens complementaire de TARN messager codant ladite 
proteine, etant entendu que si Fexpression de or/5* est affectee par cette manipulation,, 
il sera necessaire de proceder a une autre modification pour que le gene orf5* soit 
correctement exprime. La mutagenese peut etre effectuee dans la sequence codante ou 
dans une sequence non codante de maniere a rendre inactive la proteine codee ou a en 
empecher son expression ou sa traduction. La mutagenese peut etre effectuee par 
mutagenese dirigee, par remplacement de gene ou toute autre methode connue de 
l'homme du metier. Les conditions convenables d'une telle mutagenese peuvent par 
exemple etre adaptees selon Tenseignement contenu dans les ouvrages de Kieser, T et 
al (2000) et Ausubel et aL, 2002. La mutagenese peut etre effectuee in vitro ou in situ, 
par suppression, substitution, deletion et/ou addition d'une ou plusieurs bases dans le . 
gene considere ou par inactivation genique. Le microorganisme peut etre egalement 
obtenu en. exprimant les genes de la voie de biosynthese de la spiramycine sans que ' 
ceux-ci ne comprennent le gene comprenant la sequence SEQ ID N° 13 ou 1'un de ses 
variants ou l'une des sequences derivees de celles-ci en raison de la degenerescence du 
code genetique et codant un polypeptide de sequence SEQ ID N° 14 ou run de ses 
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variants. Preferentiellement le rnicroorganisme est une bacterie du genre Streptomyces. 
Plus preferentiellement le rnicroorganisme produisant de la spiramycine I mais ne 
produisant pas de spiramycinejl et III est obtenu a partir d/un rnicrojorganisme de. depart, 
produisant les spirairo'cines L II et III. Encore plus . preferentiellement, ie 
rnicroorganisme est obtenu par mutagenese dans un gene comprenant la sequence 
correspondant a SEQ ID N° 13 ou l'un de ses variants ou 1'une des sequences derivees 
de celles-ci en raison de la degenerescence du code genetique et codant un polypeptide 
de sequence SEQ ID N° 14 ou l'un de ses variants ayant la meme fonction. Encore plus 
preferentiellement, cette mutagenese est effectuee par inactivation genique. De maniere 
preferee le rnicroorganisme est obtenu a partir d'une souche de S. ambofaciens 
produisant les spiramycins I, II et III dans laquelle est effectuee une inactivation 
genique du gene comprenant la sequence correspondant a SEQ ID N° 13 ou I 'une des 
sequences derivees de celle-ci en raison de la degenerescence du code genetique. A titre 
illustratif, la souche SPM502 (or/6*::attl, cf. exemple 14) peut. etre citee comme un 
rnicroorganisme produisant de la spirantycine I mais ne produisant pas de spiramycine 
II et EL 

L/invention est egalement relative a un procede de production de spiramycine L le 
procede consiste a cultiver dans un milieu de culture approprie un rnicroorganisme ' 
produisant de la spiramycine I mais ne produisant pas de spiramycine II et III tel que • 
decrit ci-dessus, recuperer le milieu de culture conditionne ou un extrait cellulaire, 
separer et purifier a partir dudit milieu de culture ou encore a partir de 1' extrait 
cellulaire obtenu a Tetape precedente la spiramycine I. Les conditions de culture de tel 
rnicroorganisme pourront etre determines selon des techniques bien connues de 
1'homme du metier. Le milieu de culture pourra par exemple etre le milieu MP 5 ou le 
milieu SL11 pour les Streptomyces et notamment pour Streptomyces ambofaciens 
(Pernodet et aL, 1 993). L'homme du metier pourra notamment se referer a Touvrage de 
Kieser et al. 2000 en ce qui conceme la culture des Streptomyces. La spiramycine I 
produite peut etre recuperee par toutes techniques connues de 1'homme du metier. 
L ? homme du metier pourra se referer, par exemple, aux techniques enseignees dans le 
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brevet americain US 3 : 000.785 et plus particulierement aux methodes d' extraction des 
spiramycines decrites dans ce brevet. 

Un autre aspect de 1' invention concerne Tutilisation d'une sequence nucleotidique 
selon V invention pour ameliorer la production en macrolides d'un rnicroorganisme. 
Ainsi, I' invention concerne un rnicroorganisme mutant producteur de macrolide 
caracterise en ce quil possede une modification genetique dans au moins un gene 
comprenant une sequence telle que definie ci-dessus et/ou qu'elle surexprime au moins 
un gene comprenant une sequence telle que definie ci-dessus. La modification genetique 
peut consister en une suppression, une substitution, une deletion et/ou une addition d'une 
ou plusieurs bases dans le ou les genes consideres dans le but d'exprimer une ou des 
proteines ayant une activite superieure ou d'exprimer un niveau plus el eve de cette ou de 
ces proteines. La surexpression du gene considere peut etre obtenue en augmentant le 
nombfe de copies de ce gene et/ou en pla9ant un promoteur plus actif que le promoteur 
sauvage. On peut citer a titre d 5 illustration le promoteur ptrc actif chez Streptomycds 
ambofaciens (Amann, E. et aL, 1988) ainsi que le promoteur ermE* (Bibb ei aL, 1985), 
(Bibb et aL, 1994). Ainsi la surexpression du gene considere peut etre obtenue en 
apportant dans un rnicroorganisme producteur du macrolide considere une construction 
d'ADN recombinant selon rinvention, pennettant la surexpression de ce gene. En effet, 
certaines etapes de la biosynthese des macrolides sont limitantes et si Ton exprime une 
ou plusieurs proteines plus actives ou un niveau d 5 expression plus important de la ou des 
proteines sauvages impliquees dans ces etapes limitantes, on peut ameliorer la 
production du ou des macrolides concemes. Une augmentation du taux de production de 
la tylosine a par exemple ete obtenue chez Strepiomyces fradiae par duplication du gene 
codant une methyl transferase limitante convertissant la macrocine en tylosine (Baltz R> 
1997). L'obtention de V expression d'une proteine plus active peut etre obtenue 
notamment par mutagenese, Phomme du metier pourra par exemple se referer a ce sujet 
a 1'ouvrage de F.Ausubel et al (2002). Preferentiellement, ces microorganism.es mutants 
ameliores pour leur production en macrolides sont des bacteries du genre Streptomyces. 
Plus preferentiellement le macrolide en question est la spiramycine et les 
microorganism es dans lesquels sont effectuees la ou les mutageneses sont des souches 
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de S. ambofaciens. Plus preferentiellement, la modification genetique est effectuee dans 
un ou plusieurs genes comprenant une des sequences con-espondant a une ou plusieurs 
des sequences SEQ ID N° 3, 5, 7, 9, 11, 13, 15,17, 19,21,23,25,28,30, 34,36,40,43. 
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou Pun de ses valiants 
> ou Tune des sequences derivees de celles-ci en raison de la degensrescence du code 
genetique. De facon preferee, le microorganisme surexprime un ou plusieurs genes 
comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ ID 
N° 3 3 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 
64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou 1'un de ses variants ou 1'une des sequences 
derivees de celles-ci en raison de la degenerescence du code genetique. 

Un autre aspect de 1'invention conceme un procede de production de macrolides 
utilisant les microorganismes decrits au paragraphe precedent. Ce procede consiste a 
cultiver dans un milieu de culture approprie un microorganisme defini dans le 
paragraphe precedent, recuperer le milieu de culture conditionne ou un extrait cellulaire. 
separer et purifier a partir dudit milieu de culture ou encore a partir de 1'extrait 
cellulaire obtenu a l'etape precedente le ou ies macrolides produits. Les conditions de 
culture de tels microorganismes pourront etre determines selon des techniques bien 
connues de 1'homme du metier. Le milieu de culture pourra par exemple etre le milieu 
MPS ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces 
ambofaciens (Pernodet et al., 1993). L'homme du metier pourra notamment se referer a 
Pouvrage de Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. Le ou les 
macrolides produits peuvent etre recuperes par toutes techniques connues de 1'homme 
du metier. L'homme du metier pourra se referer, P ar exemple, aux techniques 
enseignees dans le brevet americain US 3,000,785 et plus parti cuiierement aux 
methodes d'extraction des spiramycines decrites dans ce brevet. Preferentiellement, les 
microorganismes utilises dans un tel procede sont des bacteries du genre Streptomyces. 
Plus preferentiellement, le " macrolide en question est la spiramycine et les 
microorganismes mutants ameliores pour leur production en spiramycines sont des 
souches de S. ambofaciens. 
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Tin autre aspect de Pinvention conceme ['utilisation d'une sequence et/ou d'un 
vecteur selon ! : invention pour la preparation d'antibiotiques hybrides. En effet, les 
polynucleotides selon Pinvention peuvent sen/ir a Pobtention de microorganismes 
exprimant une ou plusieurs proteines mutantes dormant lieu a une modification dans la 
5 specificite du substrat ou encore etre exprimes dans de multiples microorganismes 
producteurs d 5 antibiotiques dans le but de generer des antibiotiques hybrides. Ainsi les 
polynucleotides selon 1' invention peuvent permettre, par transfert des genes entre 
microorganismes producteurs, de fabriquer des antibiotiques hybrides ayant des 
proprietes phannacologiquement interessantes (Hopwood el aL, 1985a, Hopwood et 

10 aL, 1985b, Hutchinson et aL, 1989). Le principe par lequel Pingenierie genetique peut 
conduire a la production d' antibiotiques hybrides a ete tout d'abord propose par 
Hopwood (Hopwood 1981). II a ainsi ete propose que les enzymes participant a la 
biosynthese d' antibiotiques acceptent sou vent des substrats relies structurellement, mais 
differents de leur substrat naturel. II est general ement admis (Hopwood 1981, 

15 Hutchinson 1988, Robinson 1988) que les enzymes codecs par les genes de la voie de : 
bios)mthese d 'antibiotiques ont une specificite de substrat moms stricte que les enzymes 
du metabolisme primaire. II a ainsi pu etre montre qu'un grand nombre de substrats non- 
naturels sont transformes par des microorganismes producteurs d'antibiotique, leur 
mutants ou des enzymes purifiees de la voie de biosynthese de ces antibiotiques 

20 (Hutchinson 1988). En utilisant cet enseignement, l'homme du metier pourra construire 
des microorganismes exprimant une ou plusieurs proteines mutantes dormant lieu a une 
modification dans la specificite du substrat dans le but de generer des antibiotiques 
h}'brides. 

L/invention concerne egalement Putilisation d'au moins un polynucleotide et/ou 
25 au moins un ADN recombinant et/ou au moins un vecteur d'expression et/ou au moins 
un polypeptide et/ou au moins une cellule hote selon r invention pour realiser une ou 
plusieurs byconversions. Ainsi Pinvention permet de construire des souches 
bacteriennes ou fongiques dans lesquelles on exprime. sous le contrdle de signaux 
d'expression appropries, une ou plusieurs proteines selon Pinvention. De telles souches 
30 peuvent alors etre utilisees pour realiser une ou des byconversions. Ces byconversions 
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peuvent se faire soit a l'aide de cellules entieres, soit a l'aide d'extraits acellulaires des 
dites cellules. Ces byconversions peuvent permettre de transformer une molecule en une 
forme derivee, avec une enzyme d'une voie de biosynthese. Par exemple, Carreras et al 
decrit 1'utilisation de souche de Saccharopofyspora erythraea st de Streptomyces 
coelicolor pour la production de nouveau derives d'erithromycines (Carreras et al, 
2002). Walczar et al decrit 1'utilisation d'une P450 mono-oxygenase de Streptomyces 
pour la bioconversion de desacetyladriamycine (un analogue de 1'anthracycline) en de 
nouvelles anthracyclines (Walczar et al., 2001). Olonao et al. decrit 1'utiiisation d'une 
souche de Streptomyces lividans modifiee pour la bioconversion de rhodomycinone- 
epsilon en rhodomycine D (Olonao et al, 1999). L'homme du metier pourra appliquer 
ce principe a tout intermediaire de biosynthese. 

LISTE DES FTGT TR V<Z 

Figure _ l _ : Structure chimique des spiramycines I, II et III. 
Flgure 2 : Cosmides utilises pour le sequencage de la region. 

Figure!^ Organisation du groupe de genes impliques dans la voie de biosynthese des 
spiramycines. 

ig ^ re 4 : Voie de biosynthese proposee du mycarose. 
Figure 5 : Voie de biosynthese proposee du mycaminose. 
Figuree,! Voie de biosynthese proposee de la forosamine. 

fiSffieXi Ordre preferentiel d'ajout des sucres dans la molecule de spiramycine et 
intermediaires. 

Figure^ Voie de biosynthese proposee du methoxymalonyl chez 5". ambofaciens. Cette 
voie est proposee par analogie avec la biosynthese du methoxymalonyl chez 
Streptomyces hygroscopicus var. ascomyceticus (Wu,K. et al.,2000). 
Figure 9 : Etapes conduisant a I'inactivation d'un gene: 

A) Clonage du gene cible dans un vecteur se repliquant chez E. coli et pas chez 
Streptomyces; 

B) Insertion de la cassette dans le gene cible (par clonage ou recombinaison 
entre courtes sequences identiques); 
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C) Introduction du plasrnide chez Streptomyces ambofaciens (par 
transformation ou eonjugaison) et selection des clones ayant integre la cassette 
puis criblage de clones ayant perdu la partie vecteur pour avoir un remplacement 
de gene; 

D) Souche mutante dans laquelle le gene cible est inactive. 

Figure 1 0 : Etapes optionnelles suivant Pinactivation d ? un gene selon la methode decrite 
en figure 9 5 pouvant etre conduites si une cassette excisable a ete employee pour 
interrompre le gene cible ; 

E) Introduction dans la souche mutante du plasrnide pOSV508 portant les genes 
xis et int de pSAM2 dont les produits vont permettre 1'excision efficace par 
recombinaison specifique de site de la cassette; 

F) Obtention de clones ayant perdu la cassette excisable et sensibles a 
Tantibiotique a laquelle la cassette donnait la resistance; 

G) Apres croissance et sporulation sur milieu solide sans antibiotique le 
plasrnide pOSV508 est perdu a haute frequence. On peut obtenir des clones 
sensibles au thiostrepton dans lesquels le gene cible contient une deletioil en 
phase. La sequence du gene cible delete peut etre controlee par PCR et 
sequencage du produit PCR. 

Fi gure 11 ; Amplification de la cassette excisable dans le but de Putiliser pour une 
experience de recombinaison homologue. La technique de recombinaison homologue 
grace a de courtes sequences homologues a ete decrite par (Chaveroche et aL, 2000). Les 
39 ou 40 deoxy-nucleotides situes a 1'extremite 5 ! de ces oligonucleotides comportent 
une sequence correspondant a une sequence du gene a inactiver et les 20 deoxy- 
nucleotides situes le plus en 3' correspondent a la sequence d'une des extremites de la 
cassette excisable. 

Figure 12 ; Obtention d'une construction pour Pinactivation d'un gene cible grace a la 
technique decrite par (Chaveroche et aL, 2000). 

Figure 13 : Carte du plasrnide pWHM3. Strepto ori : origine de replication 
Streptomyces. 
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HgureJij.Carte du plasmide pOSV508. 

Eto^ temple de structure d'une cassette excusable. Celle-ci est constoee de la 

< 1998), entre lesquels un evenement de recombmaison penned 1'excision de la 
5 cassette., grace a 1'expression des genes xis et int. 
BgmJ6^_Caite du plasmide pBXLl 111. 
Hgure_I7_Carte du plasmide pBXLl 1 1 2. 

B« T« nticroWolog^ne de productlon en spiramydn ^ w ^ 
un. soocde de W ,c„ ^ , „ ^ ^ ^ 

• »*-. est one son* natnreiWn, sensiHe , , a spimycme r&is(mte 
Conine. Les d.fftentes souches de , ^ ^ ^ 

er =™ de 500 mI eontenan, 70 ffl , de mffieu 

— e de 2 .5 ,0< „ et mises 4 pousser 4 27 „ c _ ^ ^ ^ » 
rpn, Des prelevements de nnonts de feo.enta.ion on, e,e rtaHses apres 48 7, et 96 
henres de cnW e, censes. Une diintion an dixie™ de ces sn^'s dans dn 
nn hen de cn tor e sten ,e es« ntiiisee poor ,e ,es, La soncne indicate de 

~ a ,a con g oe,di„e maiS sens.Me a ,. spiran^ne (Oo UrmeI en „ 

7 CU '; ,VCe *" ™ 6 Wh ^ & * «*» <~ °es en pap.er Whadnan 

AA on, etc , mb oes de 7 „ p, de la di.ndon an d M4m e de cna q ne s_, e, deposes 
« U orface de ,a boit e. Des d lsq oes i mbib& d'nne soindon de spi^'ne de ' 

~ t,ons (2 " 4 - 8 ^ *" d - mi,ieu * "*■» ^ « ■*«. 
rr« 77 lk bortes sont mcub&s s 3? " c ^ 24 * «*■ * - 

on, e n , d la spiramyc;ne> ceUe d diffae ^ s ^ e( ^ ^ 
onche ,„ .catnee de ^ Ceae inh]Wtion ^ ( ha|Q ( . 

d.s.ue, ee haio refletant ,a zone on ,a soecne de Me„ W „.. pas pouss< u 
P^nce de ce „a,o es, done one indication de ,a presence de spnanr.cne e, perme, d 

iiit si sMche de s — « — - ™ es, 

P odnen.ee on no„ p ro dnc«ce de spline. Une eo m pa ra ,so„ avee ,es dia^e, 
.ndnindon o b ,enns pon r ,a gamm e d,a,o„ pe.ne, ^ nne indication de ,a ^ 
ae spiramycme produite par cette souche. 
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Figure 19 : Chromatogramme CLHP du sumageant filtre du milieu de culture de la 
souche OSC2. 

Figure 20 : Chromatogramme CLHP du sumageant filtre du milieu de culture de la 
souche SPM501. 

Figure 21 : Chromatogramme CLHP du sumageant filtre du milieu de culture de la 
souche SPM502. 

Figure 22 : Chromatogramme CLHP du sumageant filtre du milieu de culture de la 
souche SPM507. 

Figure 23 : Chromatogramme CLPIP du sumageant filtre du milieu de culture de la 
souche SPM508. 

Figure 24 : Chromatogramme CLHP du sumageant filtre du milieu de culture de la 
souche SPM509. 

Figure 25 : Alignement de la proteine Orf3 (SEQ ID N° 29) avec la proteine TylB (SEQ W 
ID N° 87) de S. fradiae realise grace au programme FASTA. 

Figure 26 : Alignement de la proteine MdmA de S. mycarofaciens (SEQ ID N° 88) avec 
la proteine SrmD (SEQ ID N° 16) realise grace au programme FASTA. ' 
Figure 27 : Exemple de sequences des sites residuels apres excision de la cassette 
excisable. En gras est indique le site att26 minimum tel que defini dans Raynal et ah, 
1998. La sequence de la phase 1 (attl) de 33 nucleotides est presentee en SEQ ID N° 
104, la sequence de la phase 2 (att2) de 34 nucleotides est presentee en SEQ ID N° 1 05 5 
la sequence de la phase 3 (att3) de 35 nucleotides est presentee en SEQ ID N° 95. 
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La presente invention est illustree a I'aide des exemples qui suivent, qui doivent 
etre eonsideres comme illustratifs et non liraitatifs. 

En resume, les_genes.de la voie de biosynthese des spiramycines ont ete isoles a 
partir d'une banque d'ADN genomique de Streptomyces ambofaciens. Cette banque a ete 
obtenue par digestion partielle de 1'ADN genomique de Streptomyces ambofaciens, par 
1'enzyme de restriction BamFd. De larges fragments d'ADN, de 35 a 45 kb en moyenne, 
ont ete clones dans le cosmide pWEDl (Gourmelen et aL, 1998) derive du cosmide 
pWEDlS (Wahl et aL, 1987). Ces cosmides ont ete introduits chez E. coli grace a des 
particules phagiques. La banque ainsi obtenue a ete hybridee avec une sonde (de 
sequence SEQ ID N° 86) correspondant a une partie du gene tylB de S. fradiae (Merson- 
Davies & Cundliffe, 1994, numero d'acces GenBank : U08223). Apres hybridation, un 
cosmide sur les 4 s'hybridant avec la sonde a ete plus particulierement selectionne. Ce 
cosmide nornme pOS49.1 a ensuite ete digere par Sad et un fragment de 3,3 kb 
contenant la region s'hybridant avec la sonde a ete sous clone dans le vecteur pUC19 et 
sequence. Quatre phases ouvertes de lectures ont ete identifies et 1'une d'entre elles 
code une proteine (SEQ ID N° 29) presentant de fortes similitudes de sequence avec la 
proteine TylB de S. fradiae (SEQ ID N° 87) (cf. figure 25). Ce gene a ete nomme orfi 
(SEQ ID N° 28) et a ete inactive chez S. ambofaciens. II a pu etre demontre que les 
clones inactives dans le gene orf3 ne produisent plus de spiramycines. Ceci montre 
1 'implication du gene or/3 ou de genes situes en aval dans la biosynthese des 
spiramycines. 

Une fois cette confirmation obtenue, une plus grande region du cosmide pOS49.1 
a ete sequencee, de part et d'autre du fragment Sad precedemment etudie. Ainsi, a partir 
du cosmide pOS49.1, la sequence d'une region comportant sept phases ouvertes de 
lecture entieres et deux autres incompletes, situees de part et d 'autre de ces sept phases 
ouvertes completes, a pu etre obtenue. Grace a une recherche dans les bases de donnees, 
il a pu etre montre que l'une des phases ouvertes de lecture incomplete correspondait au 
locus srmG (region codant une enzyme appelee « pol}4cetide synthase » (PKS)). Les 
genes correspondants ont ete clones par Burgett S. et al. en 1996 (Brevet americain US 
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5.945.320). Par ailleurs, les autres phases ouvertes de lecture, les sept ORFs entieres 
nominees : orfl, orjX orf3, or/4, or/5 f orf6 } or/7 (SEQ ID N° 23, 25, 28, 30, 34, 36, 40) 
et le debut de la huitieme ORF nomme orf8 (sequence SEQ ID N° 43.) n'ont pas ete 
retrouvees dans les bases de donnees. 

Dans un deuxieme temps et dans le but de doner d' autres genes impliques dans 
la biosynthese des spiramycines, d'autres cosmides comportant des fragments du 
genome de S. ambofaciens dans cette meme region ont ete isoles. Pour cela une nouvelle 
serie d'hybridations sur colonies a ete effectuee en utilisant trois sondes. La premiere 
sonde correspond a un fragment d'ADN de 3,7kb contenant orfl, orfl et le debut de 
orf3, sous clone a partir de pOS49.1 . La deuxieme sonde correspond a un fragment de 2 
kb d'ADN contenant une partie de orf7 et une parti e de orf8 et sous clone a partir de 
pOS49.L Une troisieme sonde a egalement ete utilisee. Cette derniere correspond a un 
fragment d'ADN de 1.8 kb contenant le gene srmD. Le gene srmD est un gene isole de & 
ambofaciens capable de conferer la resistance a la spiramycins En effet, des travaux 
anterieurs avaient permis le clonage de. plusieurs detenninants de resistance de :S 
ambofaciens, conferant la resistance a la spiramycine a une souche de S. griseofuscus 
(souche sensible a la spiramycine) (Pernodet et al., 1993) (Pernodet et al. 9 1999). Pour 
Tisolement de genes de resistances, une banque cosmidique de 1'ADN genomique de la 
souche S. ambofaciens avait ete realisee dans le cosmide pKC505 (Richardson MA et 
al., 1987). Ce pool de cosmides avait ete introduit chez S. griseofuscus, naturellement 
sensible a la spiramycine. Cinq cosmides capables de conferer la resistance a 
Papramycine et la spiramycine chez S. griseofuscus avaient ainsi ete obtenus. Parmi ces 
5 cosmides, un cosmide nomme pOS44.1 possede dans son insert le gene srmD qui code 
une proteine presentant une certaine similitude avec la proteine codee par le gene mdmA 
de Streptomyces mycarofaciens et impliquee dans la resistance a la midecamycine chez 
cet organisme producteur (Kara et al., 1990, numero d'acces Genbank : A60725) (figure 
26). La troisieme sonde utilisee pour localiser les genes de biosynthese de spiramycine a 
ete un insert d'environ l.Skb comprenant le gene srmD. 
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Ces trois sondes out ete utilisees pour hybrider la banque d'ADN genomique 
decrite ci-dessus et ont permis de choisir deux cosmides (pSPM7 et pSPM5) 
susceptibles de contenir les inserts les plus longs et n'ayant pas de bandes communes. 
Le cosmide pSMP5 hybridait avec fa premiere et la deuxieme sonde, mais n'hybridait 
pas avec la troisieme sonde, alors que le cosmide pSPM7 hybridait avec la troisieme 
sonde seulement Ces deux cosmides ont ete sequences en totalite par la technique du 
sequen?age en aveugle (« shotgun sequencing »). Les sequences des inserts de ces deux 
cosmides : pSPM7 et pSPM5 ont pu etre assemblies car bien que ne se chevauchant pas, 
chacun des inserts comprenait une sequence connue a Tune de ses extremites. En effet, 
chacun de ces inserts comportait un fragment de la sequence d'un des genes codant une 
enzymeappelee « polyketide synthase » (PKS). Ces 5 genes ont ete clones par Burgett 
S. et al en 1996 (Brevet americain US 5,945,320) (cf. figure 2). Ainsi, il a pu etre 
determine une sequence unique d'ADN genomique de S. ambofaciens. Une sequence de 
30943 nucleotides partant, en 5', d'un site EcoRI situe dans le premier gene PKS et 
allant jusqu'a un site BamHI en 3' est presentee en SEQ ID N° 1. Cette sequence 
correspond a la region amont des genes de la PKS (cf. figure 2 et 3). Une deuxieme 
region de 11171 nucleotides, partant d'un site Pstl en 5' et allant jusqu'a un site BstEll 
en 3 ' situe dans le cinquieme gene de la PKS est presentee en SEQ ID N° 2. Cette region 
est la region aval des genes de la PKS (l'aval et 1'amont etant definis par l'orientation 
des 5 genes de PKS tous orientes dans le meme sens) (cf. figures 2 et 3). . 

EXEMPLE 1 : Construction d'une banque d'ADN genomique de la souche 
ATCC23877 de Streptomyces ambofaciens chez E. coli 

1.1. Extraction de TADN genomique de la souche ATCC23877 de Streptomvces 
ambofaciens. 

La souche ATCC23877 de Streptomyces ambofaciens (accessible notamment 
aupres de 1' American Type Culture Collection (ATCC) (Manassas, Virginie, USA), sous 
le numero 23877) a ete cultivee en milieu YEME (Yeast Extract-Malt Extract) ((Kieser, 
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T 5 et a/., 2000) el PADN genomique de cette souche a ete extrait et purine selon les 
techniques standards de ]yse et precipitation (Kieser T. et aL, 2000). 

L2. Construction de ia banque d'ADN genomique 

L'ADN genomique de la souche ATCC23877 de Streptomyces ambofaciens tel 
5 qu'isole ci-dessus a ete digere partiellement par P enzyme de restriction BamHl de 
maniere a obtenir des fragments d'ADN de taille comprise entre environ 35 et 45 kb. 
Ces fragments ont ete clones dans le cosmide pWEDl (Gourmelen et aL, 1998) diger6 
au prealable par BamHl. Le cosmide pWEDl est derive du cosmide pWE15 (Wahl, et 
aL, 1987) par deletion du fragment Hpal-Hpal de 4.1 kb contenant le module 

10 d'expression actif chez les mammiferes (Gourmelen et al y 1998). Le melange de 
ligation a ensuite ete encapside in vitro dans des particules de phages lambda grace au 
systeme « Packagene® Lambda DNA packaging system » commercialise par la societe 
Promega en suivant les recommandations du fabri quant. Les particules phagjques 
obtenues ont ete utilisees pour infecter la souche SURE® d'£. coli commercialisee par 

15 la societe Stratagene (LaJolla, Californie, USA). La selection des clones a ete effe&tuee 
sur milieu LB + ampicilline (50 jig/ml) puisque le cosmide pWEDl confere la resistance 
a T ampicilline. 

EXEMPLE 2 : Isolement et caracterisation de genes impliques dans la biosj^ithese 
de spiramycin es chez Streptomyces ambofaciens 

20 2.1 Hybridation sur colonie des -clones d'£. coli de la banque genomique de 
Streptornvces ambofaciens ATCC23877 

Environ 2000 clones d'Zs. coli de la banque obtenue ci-dessus, ont ete transferes 
sur filtre pour hybridation sur colonies. La sonde utilisee pour rhybridation est un 
fragment Nael-Nael d'ADN (SEQ ID N° 86) comportant une partie du gene tylB de 
25 Streptomyces fradiae. Ce fragment correspond aux nucleotides 2663 a 3702 du fragment 
d'ADN decrit par Merson-Davies, L.A. & Cundliffe E. (Merson-Davies, L.A. & 
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Cundliffe E., 1994, numero d'acces GenBank : U08223), dans lequsl la sequence 
codante du gene tylB correspond aux nucleotides 2677 a 3843. 

Le fragment Nael-Nael d'ADN portant une parti e du gene tylB de Streptomyces 
fradiae (SEQ ID N° 86) a ete marquee au 32 P par la technique du « random priming » 
(Kit commercialise par la societe Roche) et utilise comme sonde pour Phybridation des 
2000 clones de la banque, transferes sur filtre. Les membranes utilisees sont des 
membranes nylon Hybond N comrnereialisees par la societe Amersham (Amersham 
Biosciences, Orsay, France) et rhybridation a ete efifectuee a 55°C dans le tampon deerit 
par Church & Gilbert (Church & Gilbert, 1984). Un lavage a ete effectue en 2X SSC a 
55°C pendant 15 minutes et deux lavages successifs en 0.5X SSC ont ensuite ete 
effectues a 55°C 5 d'une duree de 15 minutes chacun. Dans ces conditions d'hybridation 
et de lavage, 4 clones parmi les 2000 h}'brides presentaient un fort signal d'hybridation. 
Ces 4 clones ont ete cultives en milieu LB+ ampicilline (50 (ag/ml) et les 4 cosmides 
correspondants ont ete extraits par iyse alcaline standard (Sambrook et al, 1989). II a 
ensuite ete verifie que 1 'hybridation etait bien due a un fragment d'ADN present dans 
1'insert de ces quatre cosmides. Pour cela, les cosmides ont ete digeres independarnment 
par plusieurs enzymes (BamUI, Pstl et Sad). Les produits de digestions ont ete separes 
sur gel d'agarose, transferes sur membrane Nylon et hybrides par le fragment Nael-Nael 
d'ADN comportant une partie du gene tylB de Streptomyces fradiae (cf. ci-dessus) dans 
les memes conditions que ci-dessus. Les quatres cosmides ont pu etre valides et un de 
ces cosmides a ete plus particulierement retenu et a ete nomme pOS49. 1 . 

2.2 Verification de rimplication de la region identifiee et sequencaee de Tinsert du 
cosmide pOS49.1 

Le cosmide pOS49.1 a ete digere par l'enzyme Sacl et il a ete montre par Southern 
blot, dans les conditions decrites precedemment, qu'un fragment de 3,3 kb contient la 
region s'hj'bridant avec la sonde tylB, Ce fragment de 3,3 kb a ete isole par 
electrocution a partir d'un gel d'agarose 0.8% puis clone dans le vecteur pUC19 
(numero d'acces GenBank M77789) et sequence. Le plasmide ainsi obtenu a ete nomme 
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pOS49.1 1 . Quatre phases ouvertes de lecture presentant un usage des codons typique de 
Streptomyces ont pu etre identifiers dans ce fragment (deux completes et deux 
tronquees), grace au programme FramePlot (Ishikawa J & Hotta K. 1999). Des 
comparaisons de sequences grace au programme FASTA (cf.. (Pearson W. R & D. J. 
5 Lipman, 1988) et (Pearson W. R. ? 1990). accessible notamment aupres du centre de 
ressources INFOBIOGEN. Evry, France) ont permis de montrer que la proteine deduite 
de Tune de ces 4. phases ouvertes de lecture presente de fortes similitudes de sequence 
avec la proteine TylB (SEQ ID N° 87; Numero d'acces GenBank : U08223) de S. 
fradiae (cf figure 25). Cette proteine a ete nominee Orf3 (SEQ ID N° 29). 

10 Dans le but de tester si le gene correspondant (le gene orf3 (SEQ ID N° 28)) etait 

implique dans la biosynthese des spiramycines chez S. ambofaciens, ce gene a ete 
interrompu par une cassette Qhyg (Blondelet-Rouault M-H. et a/., 1997, numero d'acces 
GenBank : X993 15). Pour cela, le plasmide pOS49.1 1 a ete digere par r enzyme Xkol et 
le fragment contenant les quatre phases ouvertes de lecture (deux completes et deux 

15 tronquees, dont orf3 en entier) a ete sous-clone au niveau du site^TzoI du vecteur^pBC 
SK+ commercialise par la societe Stratagene (LaJolla, Califormie, USA). Le plasmide 
ainsi obtenu a ete nomme pOS49.12, Dans le but d'inactiver orfi^ un fragment PmlL- 
BstEll interne a orJ3 a ete remplace par la cassette Qhyg par clonage bout franc dans ce 
dernier plasmide. Pour cela ? le plasmide pOS49.12 a ete digere par les enzymes PmH et 

20 BstEll dont le site unique se trouve dans la sequence codante du gene or/3. Les 
extremites du fragment correspondant au vecteur ont ete rendues bouts francs par un 
traitement par 1' enzyme de Klenow (grand fragment de la DNA polym erase I). La 
cassette Qhyg a ete obtenue par digestion par P enzyme BamHI du plasmide pHP45 
Qhyg (Blondelet-Rouault et al., 1997 5 numero d'acces GenBank : X99315). Le fragment 

25 correspondant a la cassette Qhyg a ete recupere sur gel d ? agarose et ses extremites ont 
ete rendues bouts francs par un traitement par P enzyme de Klenow. Les deux fragments 
bouts francs ainsi obtenus (la cassette Qhyg et le plasmide pOS49.12) ont ete ligues et le 
produit de ligation a ete utilise pour la transformation de bacteries E, coli. Le plasmide 
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ainsi obtenu a ete nomme pOS49.14 et contient le gene or/3 interrompu par la cassette 
Qhyg. 

L'insert du plasmide pOS49.14, sous la forme d'un fragment AftoI-ATzoI dont les 
extremites out ete rendues non cohesives par un traitement par I 'enzyme de Klenow, a 
ete clone au niveau du site EcoKV du plasmide pOJ260 (le plasmide pOJ260 est un 
plasmide conjugatif capable de se repliquer chez E. coli mais incapable de se repliquer 
chez S. ambofaciens (Biennan M et al. t 1992). Ce plasmide confere la resistance a 
rapramycine chez E. coli et Streptomyces). Le plasmide obtenu (insert du plasmide 
POS49.14 clone dans le plasmide pOJ260) a ete nomme pOS49.16. Ce dernier a ete 
transfere dans la souche ATCC23877 de S. ambofaciens par conjugaison a 1'aide de la 
souche conjugate E. coli S17-1, comme decrit par Mazodier et al. (Mazodier et al., 
1989). La souche E. coli S17-1 est derivee de la souche E. coli 294 (Simon et aL 1983) 
(Simon, et al, 1986). Des clones transconjugants possedant le marqueur de resistance a 
rhygromycine porte par la cassette Qhyg et ayant perdu le marqueur de resistance a 
I'apramycine porte par le vecteur pOJ260 ont pu etre obtenus. Pour cela, apres 
conjugaison, les clones sont selectionnes pour leur resistance a 1'hygromycine. Les 
clones resistants a 1'hygromycine sont ensuite repiques respectivement sur milieu avec 
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A) (cf. figure 
9). Les clones resistants a 1'hygromycine (HygR) et sensibles a I'apramycine (ApraS) 
sont en principe ceux ou un double evenement de recombinaison s'est produit et qui 
possedent done le gene or/3 interrompu par la cassette Qhyg. Le replacement de la 
copie sauvage de or/3 par la copie interrompue a ete verifie par deux h 3 'bridations 
successives. Ainsi, 1'ADN total des clones obtenus, a ete digere par differentes enzjTnes, 
separe sur gel d'agarose, transfere sur membrane et hybrid* avec une sonde ; 
correspondant a la cassette Qhyg (cf. ci-dessus)) pour verifier la presence de la cassette 
dans I'ADN genomique des clones obtenus. Une deuxieme hybridation a ete effectuee 
en utilisant comme sonde l'insert Xhol-Xhol du plasmide pOS49.1 1 contenant les quatre 
phases xmvertes de lecture (deux completes et deux tronquees, dont or/3 en entier). La ' 
%'erification du gfeotype peut egalement etre realisee par toute methode connue de 
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l'homme du metier et notamment par PCR en utilisant les oligonucleotides appropries et 
sequen?age du produit de PCR. Un des clones or/3:: Qhyg ainsi obtenu et dont le 
genotype a ete verifie, a ete choisi et a ete appele OS49. 1 6. 

La production en spiramycine du clone OS49.16 ainsi obtenu a ete testee grace au 
test de production decrit plus bas (cf. exemple 15). II a ainsi pu etre demontre que cette 
souche ne produit plus de spiramycine, confirmant 1 'implication de orJ3 et/ou des genes 
situes en aval comme par exemple orf4 dans la biosynthese des spiramycines. 

Une fois cette confirmation obtenue, une plus grande region du cosmide pOS49.1 
a ete sequencee, de part et d'autre du fragment Sacl precedemment etudie. Ainsi, a partir 
du cosmide pOS49.1, la sequence d'une region comportant sept phases ouvertes de 
lecture entieres et deux autres incompletes, situees de part et d'autre de ces sept phases 
ouvertes completes, a pu etre obtenue. Grace a une recherche dans les bases de donnees, 
il a pu etre montre que Tune des phases ouvertes de lecture incomplete correspondent au 
locus srmG (region codant une enzyme appelee «polyketide synthase » (PKS)). Les 
genes correspondants ont ete clones par Burgett S. et al en 1996 (Brevet americain US 
5,945,320). Par ailleurs, les autres phases ouvertes de lecture: les sept ORFs entieres 
nominees : orfl, orf2, orf3, orf4 t or/5, orf6, or/7 (SEQ ID N° 23, 25, 28, 30, 34, 36 et 
40) et le debut de la huitieme ORF nommee orf8 (la sequence entiere de cette orf est 
donnee en SEQ ID N° 43) n'ont pas ete retrouvees dans les bases de donnees. 



EXEMPLE 3 : Isolernent et caracterisation d'autres genes inipliques dans la 
biosynthese de spiramycines chez Streptomyces ambofaciens 

Dans un deuxieme temps et dans le but de doner d'autres genes impliques dans la 
biosynthese des spiramycines, d'autres cosmides comportant des fragments du genome 
de S. ambofaciens dans cette meme region ont ete isoles. Pour cela il a ete precede a une 
nouvelle serie d'hybridations sur colonies en utilisant trois sondes : 
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- La premiere sonde utilisee correspond a un fragment d'ADN BamW-PstI de 3,7kb 
contenant un fragment du gene de la PKS (Les genes correspondant a la PKS out ete 
clones par Burgett S. et al.cn 1996 (Brevet americain US 5,945,32.0)), orfl., orfl et le 
debut de orfl, sous done a partir de pOS49. 1 et allant d'un site BamHl situe 1300 paires 
de bases en amont du site Ecom defmissant la position 1 de SEQ ID N° 1, jusqu'au site 
Pstl situe en position 2472 (SEQ ID N° 1). Ce fragment BamHl-Pstl a ete sous done a 
partir de pOS49.1 dans le plasmide pBC SK+, ce qui a permis d'obtenir le plasmide 
pOS49.28. 



- La deuxieme sonde utilisee correspond a un fragment d'ADN Pstl-BamUl d'environ 
10 2kbcontenantunfragmentd^y7etd^souscloneapartirdepOS49.1 etallantd'un 
site Pstl situe en position 6693 de SEQ ID N° 1 jusqu'au site BamHl situe en position 
8714 de SEQ ID N° 1. Ce fragment Pstl-BamUl a ete sous clone a partir de pOS49.I 
dans le plamside pBC SK +; ce qui a permis d'obtenir le plasmide pOS49.76. 

- Une troisieme sonde a egalement ete utilisee. Cette derniere correspond a un 
15 fragment d'ADN de 1.8kb EccM-Hintim contenant le gene srmD. Le gene srmD est un 
gene isole de S. ambofaciens capable de conferer la resistance a la spiramycine. En effet, 
des travaux anterieurs avaient permis le clonage de plusieurs determinants de resistance' 
de S. ambofaciens, conferant la resistance a la spiramycine a une souche de S 
griseofuscus (souche sensible a la spiramycine) (Pernodet et al., 1993) (Pernodet et al, 
0 1 999). Pour isoler des genes de resistance, une banque cosmidique de 1'ADN genomique 
de la souche S. ambofaciens ATCC23877 avait ete realisee dans le cosmide pKCS05 
(Richardson MA et al., 1987). Pour cela l'ADN genomique de la souche S. ambofaciens 
ATCC23877 avait ete digere partiellement par SauSAl de maniere a obtenir des 
fragments de faille comprise entre environ 30 et 40 kb. L'ADN genomique ainsi digere 
(3ug) avait ete ligue avec Ipg du pKC505 prealablement digere par Penzyme BamHl 
(Pernodet et al, 1999). Le melange de ligation avait ensuite ete encapside in vitro dans 
des particules phagiques. Les particules pfaagiques obtenues avaient ete utilisees pour 
infecter la souche d'£ coli HB101 (accessible notamment aupres de ^American Type 
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Culture Collection (ATCC) (Manassas, Virginia USA), sous le numero 33694). Environ 
20 000 clones d r E. coli resistant a I'apramycine avaient ete pooles et les cosmides de ces 
clones avaient ete extraits. Ce pool de cosmides avait etc introduit par transformation de. 
protoplastes dans la souche DSM 10191 de S. griseofuscus (Cox KL & Baltz RH. 1984), 
naturellement sensible a la spiramycine (Rao RN et aL, 1987, cette souche est disponible 
notamment aupres de la German Collection of Microorganisms and Cell Cultures 
(Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, DSMZ), 
(Braunschweig, Allamagne), sous le numero DSM 10191). Les transformants avaient ete 
selectionnes sur un milieu contenant de I'apramycine. 1300 des clones poussant sur 
milieu contenant de I'apramycine avaient ete transferees sur milieu contenant 5fig/ml de. 
spiramycine. Plusieurs clones resistants a I'apramycine avaient egalement pousse sur 
milieu contenant de la spiramycine et les cosmides de ces colonies avaient ete extraits et 
utilises pour transformer E. coli et S. griseofuscus (Pernodet et al. 9 1999). Cinq cosmides 
capables de conferer la resistance a I'apramycine a E. coli et la co-resistance a 
I'apramycine et la spiramycine chez S. griseofuscus avaient ainsi ete obtenus. Parmi ces 
5 cosmides, il a ete determine qu'un cosmide nomme pOS44.1 possede dans son insert 
un gene (SEQ ID N° 15) qui code une proteine (SEQ ID N° 16) presentant une certaine 
similitude avec une proteine codee par le gene mdmA de Streptomyces mycarofaciens 
(SEQ ID N° 88), ce gene a ete nomme srmD (cf. alignement presente en figure 26 
realise grace au programme FASTA (cf.. (Pearson W. R & D. J. Lipman, 1988) et 
(Pearson W. R., 1990), accessibles notamment aupres du centre de ressources 
INFOBIOGEN, Evry, France). 

Pour isoler le determinant de resistance contenu dans le plasmide pOS44.1, celui- 
ci a ete digere parti ellement par P enzyme de restriction Sau3Al de maniere a obtenir des 
fragments de taille environ 1,5 a 3 kb, ces fragments ont ete ligues dans le vecteur 
pIJ486 linearise par P enzyme BamRl (Vv^ard et al, 1986). Un plasmide a ete selectionne 
pour sa capacite a conferer la resistance a la spiramycine chez la souche DSM 10191 de 
S. griseofuscus (Rao RN et al, 1987), naturellement sensible a la spiramycine (cf. ci- 
dessus). Pour cela, le pool de plasmides correspondant aux fragment SauSAl de pOS44.1 
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ligues dans le vecteur pIJ486 (cf. ci-dessus), a ete introduit par transformation de 
protoplastes dans la souche DSM 10191 et les transformants ont ete selectionnes pour 
leur resistance an thiostrepton (due au gene tsr porte par P I.T486). Les clones poussant - 
sur milieu contenant du thiostrepton ont ete transferes sur milieu contenant de la 
5 spiramycin. Plusieurs clones resistants au thiostrepton ont egalement pousse sur milieu 
contenant de la spiramycine et les plasmides de ces colonies ont ete extraits. Un 
plasmide conferant la resistance et contenant un insert d'environ l.Skb a ete selectionne 
et nomme pOS44.2. Cet insert de 1 .Skb peut etre sorti facilement grace a un site Hindlll 
et un site EcoRI presents dans le vecteur de part et d'autre de i'insert. Cet insert de 1 .8kb 
> HindUl-Ecom a ete sequence et le gene de resistance qu'il renferme a ete nomme srmD. 
Ce fragment contenant le gene srmD a ainsi pu atre facilement sous-clone dans le 
vecteur pUC19 (numero d'acces GenBank M77789) ouvert par EcoRI-Hindlll, le 
plasmide obtenu a ete nomme pOS44.4. L'msert de l.Skb Hindlll-EcoKL, contenant le 
gene srmD, de ce plasmide a ete utilise comme sonde pour localiser les genes de 
biosynthese de spiramycine (cf. ci-dessous). 

Un echantillon d'une souche Escherichia Coli DH5a contenant le plasmide 
POS44.4 a ete depose aupres de la Collection Nationale de Cultures de Microorganismes 
(CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France, le 10 
judlet 2002 sous le numero d'enregistrement 1-2918. 

Environ 2000 clones de la banque, obtenus ci-dessus (cf. exemple 1), ont ete 
transferes sur filtre pour hybridation sur colonies selon les techniques classiques 
(Sambrook et ah, 1989). 

Les trois sondes decrites ci-dessus ont ete marquees au 32 P par la technique du « 
-random priming » (Kit commercialise par Roche) et utilisees pour l'hybridation des 
2000 clones de la banque, transferes sur filtre. L'hybridation a ete effectuee a 65<»C dans 
le tampon decrit par Church & Gilbert (Church & Gilbert, 1984). Un lavage a ete 
effectue en 2X SSC a 65°C pendant 15 minutes et deux lavages successes ont ensuite 
ete effectues en 0.5X SSC a 65°C, d'une duree de 15 minutes chacun. Dans ces 
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conditions d'hybridation et de lavage, 16 clones parmi les 2000 hybrides presentaient un 
fort signal d 'hybridation avec an moins une des sondes. Cependant, ancun cosmide 
n'hybridait avec les trois sondes. Les 16 cosmides ont ete extraits et digeres par 
T enzyme de restriction BamHl. La comparaison des profils de restriction de ces 
differents cosmides entre eux, a conduit a choisir deux cosmides susceptibles de contenir 
les inserts les plus longs de la region et n'ayant pas de bandes communes. Ainsi deux 
cosmides l'un nomme pSPM5 et l'autre pSPM7 ont ete choisis. Le cosmide pSPMS 
hybridait avec les sondes orfl a orf4 et la sonde orf8, mais n'hybridait pas avec la sonde 
srmD. pSPM7 hybridait seulement avec la sonde srmD et pas avec les deux autres 
sondes. 

Ces deux cosmides ont ete sequences en totalite par la technique du sequen9age en 
aveugle (« shotgun sequencing »). Les sequences des inserts de ces deux cosmides : 
pSPM7 et pSPM5 ont pu etre assemblies car bien que ne se chevauchant pas, chacun 
des inserts comprenait une sequence connue a' Tune de ses extremites. En effet chacun 
de ces inserts comportait un fragment de la sequence d'un des genes codant une enzyme 
appelee « polyketide synthase » (PKS). Ces 5 genes ont ete clones par Burgett S. et al 
en 1996 (Brevet americain US 5,945,320) (cf. figure 2). Ainsi, il a pu etre determine une 
sequence unique d'ADN genomique de S. ambofaciens. Une sequence de 30943 
nucleotides partant en 5' d'un site EcoRI situe dans le premier gene PKS et allant 
jusqu'a un site BamHl en 3' est presentee en SEQ ID N° 1. Cette sequence correspond a 
la region amont des genes de la PKS (cf. figure 2 et 3). Une deuxieme region de 11171 : 
nucleotides, partant d'un site Pstl en 5' et allant jusqu'a un site Ncol en V situe dans le 
cinquieme gene de la PKS est presentee en SEQ ID N° 2. Cette deuxieme region est la 
region aval des genes de la PKS (l'aval et V amont etant defini par V orientation des 5 
genes de PKS tous orient es dans le meme sens) (cf. figure 2 et 3). 
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EXEMPLE 4 : Analyse des sequences nucleotidiques, determination des 
phases ouvertes de lecture et caracterisation des genes impliques dans la 
biosynthese des spiramycines. 

Les sequences obtenues ont ete analysees grace au programme FramePlot 
(Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi les phases ouvertes de 
lecture, les phases ouvertes de lecture presentant un usage des codons typique de 
Streptomyces. Cette analyse a permis de determiner que cette region comporte 35 ORFs 
localisees de part et d 'autre de cinq genes codant I 'enzyme «polyketide synthase)) 
(PKS). Respectivement 10 et 25 ORFs ont ete identifiees en aval et en amont de ces 
genes (I'aval et 1 'amont etant defini par 1' orientation des 5 genes de PKS tous orientes 
dans le meme sens) (cf. figure 3). Ainsi, les 25 phases ouvertes de lecture de ce type, 
occupant une region d'environ 31 kb (SEQ ID N° 1 et figure 3) ont ete identifiees en 
amont des 5 genes codant la PKS et 10 occupant une region d'environ 1 1,1 kb (SEQ ID 
N° 2 et figure 3), ont ete identifiees en aval des genes de la PKS. Les genes de la region 
amont ont ete nommes orfl, or/2, or/3, or/4, or/5, or/6, or/7, orfl, or/9c, or/70, orfllc, 
or/72, orfl 3c, orfl 4, orfl 5c, orfl 6, or/17, or/18, or/19, or/20, orfllc, orf22c, or/23c, ■ 
• orf24c et orflSc (SEQ ID N° 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 
66, 68, 70, 72, 74, 76, 78, 80, 82 et 84). Les genes de la region aval ont ete nommes 
orfl*c, orfl*c, or/3*c, or/4*c, orfl* or/6* orfl*c, orfl* orfl* or/10* (SEQ ID N° 3, 
5, 7, 9, 11, 13, 15, 17, 19 et 21). Le « c » ajoute dans le nom du gene signifiant pour 
l'ORF en question que la sequence codante est dans I'orientation inverse (le brin codant 
est done le brin complementaire de la sequence donnee en SEQ ID N° 1 ou SEQ ID N° 2 
pour ces genes) (cf. figure 3). 

Les sequences proteiques deduites de ces phases ouvertes de lecture ont ete 
comparees avec celles presentes dans differentes bases de donnees grace a differents 
programmes : BLAST (Altschul et al., 1990) (Altschul et al, 1997), CD-search, COGs 
(Cluster of Orthologous Groups) (ces trois programmes sont accessibles notamment 
aupres du National Center for Biotechnology Information (NCBI) (Bethesda, Maryland, 
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990). 
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BEAUTY* (Worley K. C e£ a/., 1995)), (ces deux programmes sont accessibles 
notamment aupres du centre de ressources INFOBIOGEN, Evry, France). Ces 
comparaisons ont permis de formuler des hypotheses sur la fonction des produits de ces 
genes et d 'identifier ceux susceptibles d'etre impliques dans la biosynthese de 
spiramycine. 

EXEMPLE 5 : Inactivation de gene : principe de la construction d'une 
souche de Streptomyces ambofaciens interrompue 

Les methodes utilisees consistent a effectuer un remplacement de gene. Le gene cible 
a interrompre est remplace par une copie de ce gene interrompue par une cassette 
conferant la resistance a un antibiotique (par exemple l'apramycine ou 1'hygromycine), 
comme l'illustre la figure 9. Les cassettes utilisees sont bordees de part et d'autre par des 
codons de terminaison de la traduction dans toutes les phases de lecture et par des ; 
terminateurs de transcription actifs chez Streptomyces. • / 

Uinsertion de la cassette dans le gene cible peut s'accompagner ou non d'une deletion 
dans ce gene cible. La taille des regions flanquant la cassette peut aller de quelques 
centaines a plusieurs milliers de paires de bases. 

Les constructions necessaires a 1' inactivation du gene par la cassette ont ete obtenues 
chez E. coli, organisme de reference pour l'obtention de constructions d'ADN 
recombinant. Le gene interrompu a ete obtenu dans un plasmide se repliquant chez E. 
coli mais ne pouvant pas se repliquer chez Streptomyces. 

Les constructions ont ensuite ete sous-clonees dans des vecteurs pour permettre la 
transfonnation et Finactivation du gene voulu chez S. ambofaciens. Pour cela. deux 
plasmides ont ete utilises : 

- pOJ260 (Bierman M. et aL 9 1992) (cf. exemple 2) qui confere la resistance a 
l'apramycine chez E, coli et Streptomyces et qui a ete employe quand le gene cible 
a ete interrompu par une cassette conferant la resistance a rhygromycine. 

- pOSKl 205 (4726pb). Ce plasmide derive du plasmide pBK-CMV (commercialise 
par la societe Stratagene (LaJolla ? California USA)) dans lequel un fragment 
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Avrll contenant la sequence codant la resistance a la Neomycine/Kanamycine a 
ete remplace par une sequence codant la resistance a I'hygromycine, tout en 
con se rvant le promoteur P S V40. Pour cela ; le plasmide pHP45-flfog (Blondelet- 
. Rouault et al, 1997) a ete digere.par les enzymes Noil et Pflml et,le fragment 
conferant la resistance a I'hygromycine a ete sous-clone au niveau du site^vrll du 
vecteur pBK-CMV apres que toutes les extremites aient ete rendues bout franc 
par traitement a l'enzyme de Klenow. Dans pOSK1205, la cassette qui confere la 
resistance a I'hygromycine est precedee du promoteur pSV40. Ce plasmide 
confere la resistance a I'hygromycine chez E. coli et Streptomyces et a ete 
employe quand le gene cible a ete interrompu par une cassette conferant la 
resistance a I'apramycine. 



Les cassettes ont ete introduites dans le gene cible soit par clonage en utilisant des 
sites de restriction presents dans le gene cible, soit par recombinaison entre de courtes 
sequences identiques comme decrit par exemple par Chaveroche et al (Chaveroche MK 
15 et al, 2000). 

Le plasmide portant le gene interrompu par la cassette peut ensuite etre introduit chez 
Streptomyces ambofaciens, par exemple par conjugaison entre E. coli et Streptomyces 
(Mazodier P, et al, 1 989). Cette technique a ete utilisee dans le cas ou le vecteur de base 
est le vecteur pOJ260. Une deuxieme technique peut etre utilisee : la technique de la 
0 transformation de protoplastes apres denaturation par traitement alcalin de I'ADN 
(Kieser, T et al, 2000), pour augmenter la frequence de recombinaison comme decrit 
par exemple par Oh & Chater (Oh & Chater, 1997). Cette technique a ete utilisee dans le 
cas ou le vecteur de base est pOT260 ou pOSK1205 (cf. ci-dessous). Les transformants 
sont ensuite selectionnes avec l'antibiotique correspondant a la cassette presente dans le 
gene cible (cf. figure 9, antibiotique B). On selectionne ainsi un melange de clones 
parmi lesquels il y a eu integration par un seul ou par deux evenements de 
recombinaison. Dans un deuxieme temps on recherche les clones sensibles a 
l'antibiotique pour lequel le gene de resistance est present dans le vecteur (hors de la 
cassette de recombinaison) (cf. figure 9, antibiotique A). On peut ainsi selectionner les 
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clones pour lesquels il y a eu en principe deux evenements de recombinaison aboutissant 
au remplacement du gene sauvage par la copie interrompue par la cassette. Ces etapes 
sont schematisees figure 9. 

Plusieurs cassettes peuvent etre utilisees pour 1 'interruption des genes cibies. On peut 
5 par exemple utiliser la cassette Qhyg qui confere la resistance a lTij'gromycine 
(Blondelet-Rouault et al, 1997, numero d'acces GenBank : X99315). 

EXEMPLE 6 : Construction d'une souche de Streptomyces ambofaciens 
interrompue en phase dans le gene orfS 

10 Le gene orf 3 avait ete interrompu par la cassette Qhyg (cf. exemple 2.2) et il a pu 

etre demontre qu'une souche orf3:: Qhyg ne produit plus de spiramycine, confirmant 
Timplication d'un ou plusieurs genes de la region clonee dans la biosynthese des 
spiramycines (cf. exemple 2.2). Au vu de leur orientation, une cotranscription des ORFs 
1 a 7 est probable (cf, figure 3) et le phenotype observe (non producteur de 

15 spiramycines) peut etre du a Finactivation d'un ou plusieurs des genes co-transcrits avec 
or/3. Pour confirmer Fimpli cation de orf 3 dans la biosynthese de spiramycines, une 
nouvelle inactivation du gene orJ3 a etc effectuee, cette derniere etant realisee en phase. 
Pour cela, un fragment Dralll interne a orj3 de 504 paires de bases a ete delete. Un 
fragment d'ADN obtenu a partir de pOS49.1 5 allant du site EcoRl situe en position 1 

20 (SEQ ID N° 1) jusqu'au site Sad situe en position 5274 (SEQ ID N° 1) et qui comporte 
une deletion entre les deux sites Z)raIII aux positions 2563 et 3067 (504 nucleotides 
retires) a ete clone dans le plasmide pOJ260 (Bierman M. et al., 1992). Le plasmide 
ainsi obtenu a ete nomme pOS49.67. 

L T insert de pOS49.67 est done constitue par un fragment d'ADN de S. ambofaciens 
25 contenant les genes orff orf2, or/3 avec la deletion en phase, or/4 et une partie de orf5. 
Le vecteur dans lequel cet insert a ete sous-clone est pOJ260 3 le plasmide pOS49.67 
confere done la resistance a rapram) ; cine et a ete introduit par transformation de 
protoplastes dans la souche OS49.16 (cf. exemple 2). La souche OS49.16 etant resistante 
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a l'hygromycine, des transformants bygR et apraR ont ete obtenus. Apres deux passages 
de tels clones sur milieu non selectif, les clones sensibles a 1'apramycine et a 
l'hygromycine (apraS et hygS) ont ete recherches. Dans certains.de ces clones, on. 
s'attend en effet a ce qu'un evenement de recoxnbinaison entre sequences homologues 
conduise au remplacement de la copie de or/3 mterrompue par la cassette Qhyg (contenu 
dans le genome de la souche OS49.16) par la cop ie de or/3 avec la deletion en phase 
presente sur le vecteur. Les clones resultant de cette recombinaison son! attendus comme 
apraS et hygS apres I'elimination des sequences du vecteur. Le genotype des souches 
ainsi obtenues pent etre verifie par hybridation ou par PGR et sequencage du produit de 
PCR (pour verifier que seule une copie de or/3 deletee en phase est presente dans le 
genome des clones obtenus). Des clones n'ayant que la copie de or/3 avec une deletion 
en phase ont ainsi ete obtenus et leur genotype a ete verifie. Un clone presentant les 
caracteristiques recherchees a ete plus particulierement selections et a ete nomme 
OS49.67. 

Un echantillon de la souche OS49.67 a ete depose aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 
1-2916. 



EXEMPLE 7 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orfS 

Pour realiser l'inactivation du gene or/8, une construction dans laquelle la cassette : 
Ohyg a ete introduite dans la sequence codante de or/8 a ete obtenue. Pour cela, le 
plasmide pOS49.88 a tout d'abord ete construit. Le plasmide pOS49.S8 est derive' du 
plasmide pUC19 (numero d'acces GenBank M77789) par insertion d'un fragment de 3.7 
kb (fragment Pstl-EcoKL obtenu a partir du cosmide pSPM5), contenant la fin de orJ7 : 
orf8 et le debut de or/9, clone dans les sites Pstl-EcoRl de pUC19. La cassette Qhyg 
(sous forme d'un fragment BamHI, rendu bout franc par traitement a 1 'enzyme de 
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Klenow) a ete clonee au niveau du site unique Sail de pOS49.88 situe dans orf8 apres 
que toutes les extremites aient ete rendues bout franc par traitement a P enzyme de 
Klenow. 

Le clonage etant bout franc, deux types de plasmides ont ete obtenus selon le sens 
d r insertion de la cassette : pOS49.106 dans lequel les genes hyg et or/8 sont dans la 
meme orientation et pOS49.120 dans lequel les genes hyg et or/8 sont dans des 
orientations opposees. L'insert du plasmide pOS49.106 a ensuite ete sous-clone dans le 
plasmide pOJ260 pour donner pOS49.107. Pour cela, le plasmide pOS49.106 a ete 
digere par Y^wzymoAspl\%l et les extremites ont ete rendues bout franc par traitement a 
r enzyme de Klenow, ce produit de digestion a ete redigere par P enzyme Pstl et le 
fragment contenant le gene or/8 dans lequel la cassette Qhyg a ete inseree, a ete clone, 
dans le vecteur pOJ260 (cf. ci dessus). Pour cela, le vecteur pOJ260 a ete digere par les, 
enzymes EcoRV et Pstl et utilise pour la ligation. Cette manipulation permet donc< 
d'obtenir une ligation orientee puisque chacun des deux fragments est bout franc d'un 
cote et Pstl de P autre. Le plasmide obtenu a ete nomme pOS49. 1 07. - V 

Le plasmide pOS49.107 a ete introduit dans la souche ATCC23877 de S. 
ambofaciens par transformation de protoplastes (Kieser, T et aL, 2000). Apres 
transformation des protoplastes, les clones sont selectionnes pour leur resistance a 
Phygromycine. Les clones resistants a Ph^^gromycine sont ensuite repiques 
respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec 
apramycine (antibiotique A) (cf. figure 9). Les clones resistants a Phygromycine (PfygR) 
et sensibles a P apramycine (ApraS) sont en principe ceux ou un double evenement de 
crossing over s'est produit et qui possedent le gene orfS interrompu par la cassette Qhyg, 
Le remplacement de la copie sauvage de or/8 par la copie interrompue par la cassette 
Qhyg a etc verifie par Southern Blot. Ainsi, PADN total des clones obtenus, a ete digere 
par plusieurs enzymes, separe sur gel d'agarose, transfere sur membrane et hybride avec 
une sonde correspondant a la cassette Qhyg pour verifier la presence de la cassette dans 
PADN genomique des clones obtenus. Une deuxieme hybridation a ete effectuee en 
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utilisant comme sonde I'insert Psil-EcoM contenant la fin de or/7, or/8 et le debut de 
orfi d'une taille d'environ 3,7 kb du plasmide pOS49.88. La verification du genotype 

peUt dtrC r6aIls6e P ar toute methode connue de Lhomme du meter et notamment par 

PCR en utilisant Jes oligonucleotides appropries et sequencage du produit de PCR. 

Un clone orf8::Qhyg a ete choisi et nomme OS49. 107. Un echantillon de la souche 
OS49.107 a ete depose aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-291 7. 

EXEMPLE 8: Construction d'une souche de Streptomyces ambofaciens 
10 interrompue dans le gene orflO 

Un fragment d'ADN de 1,5 kb interne an gene or/70 a ete obtenu par PCR en 
utilisant comme matrice, l'ADN genomique de S. ambofaciens et les amorces suivantes : 

SRMRl : 5' CTGCCAGTCCTCTCCCAGCAGTACG 3' (SEQ ID N° 89) 
SRMR2 : 5' TGAAGCTGGACGTCTCCTACGTCGG 3' (SEQ ID N<> 90). 

Ce fragment d'ADN issu de la PCR a ete clone dans le vecteur P CR2.1 commercialise 
par la societe Invitrogen (Carlsbad, Californie, USA). Le plasmide ainsi obtenu a ete 
nomme pOS49.32. La cassette Qhyg (sons forme d'un fragment BamKl, cf. ci-dessus) a 
ete clonee au niveau du site unique BstEll interne an fragment du gene or/10, apres que 
toutes les extremUes aient ete rendnes bout franc par traitement a 1'enzyme de Klenow. 
Le clonage etant bout franc, deux types de plasmides ont ete obtenus selon le sens 
d'insertion de la cassette : P OS49.43 dans lequel les genes hyg et orflO sent dans la 
mgme orientation et pOS49.44 dans lequel les genes hyg et or/W sont dans des 
orientations opposees. L'insert du plasmide P OS49.43 a ete transfere (sous forme d'un 
fragment ^7181-^1 dont les extremites ont ete rendues bout franc par traitement a 
I'enzyme de Klenow) dans le site EcoRV du plasmide P OJ260 ce qui a permis d'obtenir 
le plasmide pOS49.50. Le plasmide pOS49.50 contenant le fragment du gene orflO 
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interrompu par la cassette Qhyg a ete introduit dans la souche ATCC23877 de 
Streptomyces ambofaciens. Apres transformation, les clones sont selectionnes pour leur 
resistance a l'hygromycine. Les clones resistants a rhygromycine sont ensuite repiques 
respectivement sur milieu avec h)'gromycine (antibiotique B) et sur milieu avec 
5 apramycine (antibiotique A) (cf. figure 9). Les clones resistants a l'hygromycine (HygR) 
et sensibles a V apramycine (ApraS) sont en principe ceux ou un double evenement de 
crossing over s'est produit et qui possedent le gene orflO interrompu par la cassette 
Qhyg. Des clones qui possedaient le marqueur de resistance a l'hygromycine porte par la 
cassette et qui avaient perdu le marqueur de resistance a Tapramycine porte par le 

10 vecteur pOJ260 ont ainsi ete obtenus. L'evenement de remplacement de la copie sauvage 
de or/20 par la copie interrompue orfl O:\Qhyg a ete verifie par Southern Blot. Ainsi, 
l'ADN genomique total des clones obtenus, a ete digere par plusieurs enzymes, separe 
sur gel d' agarose, transfere sur membrane et hybride avec une sonde correspondant a la,. r 
cassette Qhyg pour verifier la presence de la cassette dans l'ADN genomique des clones^ 

15 obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde le produit 
PCR de 1,5 kb interne au gene orfl 0 (cf. ci-dessus). 

Un clone presentant les caracteristiques attendues (orfl O:\Qhyg) a ete plus 
particulierement selectionne et nomme OS49.50. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette Qhyg etait bien presente dans le genome de ce clone et 

20 que Ton obtient bien le profil de digestion attendu dans le cas d'un remplacement, a la 
suite d'un double evenement de recombinaison, du gene sauvage par la copie 
interrompue par la cassette Qhyg dans le genome de ce clone. La verification du 
genotype peut egalement etre realisee par toute methode connue de Phomme du metier 
et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age du 

25 produit de PCR. 
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EXEMPLE 9 : Inactivation de genes : principe de la construction d'une 
souehe de Streptomyces ambofaciens interrompue selon la technique des « cassettes 
excisabies » (cf. Figure 9 et 10) 



Un deuxieme type de cassettes peut etre utilise pour Pinactivation de genes : les 
cassettes dites « cassettes excisabies ». Ces cassettes presentent l'avantage de pouvoir 
etre excisees chez Streptomyces par un evenement de recombinaison specifique de site 
apres avoir ete introduites dans le genome de S. ambofaciens. Le but est d'inactiver 
certains genes dans des souches de Streptomyces sans laisser dans la souche finale de 
marqueurs de selection ou de grandes sequences d'ADN n'appartenant pas a la souche. 
Apres excision il subsiste uniquement une courte sequence d 'environ une trentaine de 
paires de bases (appele site « cicatriciel ») dans le genome de la souche (cf. figure 1 0). 

La mise en oeuvre de ce systeme consiste, dans un premier temps, au remplacement 
de la copie sauvage du gene cible (grace a deux evenements de recombinaison 
homologue, cf. figure 9) par une construction dans laquelle une cassette excisable a ete 
inseree dans ce gene cible. L'insertion de cette cassette est accompagnee d'une deletion 
dans le gene cible (cf. figure 9). Dans un deuxieme temps, 1 'excision de la cassette 
excisable du genome de la souche est provoquee. La cassette excisable fonctionne grace 
20 a un systeme de recombinaison specifique de site et a pour avantage de permettre 
l'obtention de mutants de Streptomyces ne portant finalement pas de gene de resistance. 
On s'affranchit egalement d'eventuels effets polaires sur 1'expression des genes situes en 
aval du ou des genes inactives (cf. figure 10). 

L'emploi de cassettes excisabies a ete decrit et utilise chez de nombreux organismes 
25 dont les cellules de mammifere, de levures et chez E. coli (Bayley et al, 1992 ; Brunelli 
et Pall, 1993 ; Camilli et al., 1994 ; Dale et Ow, 1991 .; Russell et al, 1992; Lakso et al, 
1992). Ces cassettes excisabies utilisent toutes la recombinase specifique de site Cre 
agissant sur les sites lox. Ce systeme de recombinaison provient du bacteriophage P 1 . 
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Pour la construction d 'un systeme de type « cassette excisable » chez Streptomyces, il 
a ete tire partie du systeme de recombinaison specifique de site decrit pour P element 
genetique mobile pSAM2 de Streptomyces ambofaciens (Boccard et al, 1989a et b). Le 
systeme mis en place consiste dans un premier temps a construire un vecteur 
5 recombinant comportant le gene a interrompre dans lequel est inseree une cassette 
excisable. L'insertion dans le gene cible de la cassette excisable s'accompagne d'une 
deletion dans le gene cible. Elle pent etre realisee par clonage en utilisant des sites de 
restriction presents dans le gene cible ou par recombinaison entre de courtes sequences 
identiques comme decrit par exemple par Chaveroche et al (Chaveroche MK et ah, 

10 2000). La cassette excisable peut etre construite en utilisant par exemple la cassette 
Qhyg (Blondelet Rouault et al, 1997). Cette cassette a ete bordee par des sequences attR 
et attL qui flanquent normalement la copie integree de pSAM2 (cf. figure 1 5). Les 
sequences attL et attR contiennent tous les sites necessaires a la recombinaison sife- 
specifique permettant Pexcision de pSAM2 ou de tout fragment d'ADN situe entre ces 

15 deux regions (Sezonov et al, 1997, Raynal et al, 1998). La construction d'une telle 
cassette n'est evidemment pas limitee a Putilisation d'une cassette Qhyg, mais d'autres 
cassettes de resistances peuvent servir de base a la construction de cette cassettte (par 
exemple la cassette Qaac ou Qvph (Blondelet Rouault et al. t 1997)). 

Apres Pobtention de cette construction, la souche de Streptomyces est transformer 
20 avec le plasmide recombinant. Les transformants sont ensuite selectionnes avec 
l'antibiotique correspondant a la cassette presente dans le gene cible (cf. figure 9, 
antibiotique B, il s'agit par exemple d'une selection par Phygromycine si la cassette 
excisable derive de la cassette Qhyg). On selectionne ainsi un melange de clones parmi 
lesquels il y a eu integration par un seul ou par deux evenements de recombinaison. 
25 Dans un deuxieme temps on recherche les clones sensibles a Tantibiotique pour lesquels 
le gene de resistance est present dans le vecteur (hors de la cassette de recombinaison) 
(cf. figure 9, antibiotique A). On peut ainsi selectionner les clones pour lesquel il y a eu 
en principe deux evenements de recombinaison aboutissant au remplacement du gene 
sauvage par la copie interrompue par la cassette. Ces etapes sont schematises figure 9 ; 
30 le genotype des clones ainsi obtenus est verifie par Southern blot et une souche 
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presentant Ies caracteristiques voulues (le remplacement du gene sauvage par la copie 
interrompue par la cassette excisable) est selectionnee. 

- Dans un deuxieme temps, la souche selectionnee ci-dessus, est transfotmee par un 
plasmide permettant I'expression des genes xis et int qui sont tous deux neeessaires a la 
recombinaison specifique de site entre les sites attR et attL. Cette recombinaison 
entraine le depart de la cassette excisable du genome de la souche, grace a un evenement 
de recombinaison (cf figure 10) (Raynal et aL, 1998). II est interessant de choisir le 
vecteur portant les genes xis et int parmi les vecteurs relativement instables chez 
Streptomyces (par exemple derive du vecteur Streptomyces pWHM3, (Vara et aL, 
1989)), ceci perrnet d'obtenir une souche ayant perdu ce dernier vecteur apres quelques 
cycles de sporulation en absence de pression de selection. 

Pour exciser la cassette, on peut par exemple utiliser le plasmide pOS V508 (cf. figure 
14) qui est introduit par transformation de protoplastes dans la souche de S. ambofaciens 
contenant un gene interrompu par la cassette excisable. Le plasmide pOS V508 est derive 
du plasmide pWHM3 (Vara J et aL, 1989) (cf. figure 13) dans lequel ont ete ajoutes les 
genes xis et int de pSAM2 (Boccard F. et aL, 1989b) places sous le controle du 
promoteur ptrc (Amann, E. et aL, 1988). Les genes xis et int places sous le controle du 
promoteur ptrc ont etc sous clones dans le plasmide pWHM3 a partir du plasmide 
pOSint3 (Raynal et aL, 1998) (cf. figure 14). L'introduction dans la souche mutante du 
plasmide pOSV508 portant les genes xis et int de pSAM2 va permettre l'excision 
efficace par recombinaison specifique de site de la cassette excisable entre les sites attL 
et attR flanquant cette cassette (Raynal A. et aL, 1998) (figure 10). Parmi les 
transformants, selectionnes pour leur resistance au thiostrepton due au gene tsr porte par 
pOSV508, on choisit ceux devenus sensibles a l'antibiotique auquel la presence de la 
cassette confere la resistance (cf. figure 10). L'excision est efficace et il a ete observe 
que plus de 90% des transformants sont de ce tj^pe. Apres un ou plusieurs cycles de 
croissance et sporulation sur un milieu solide depourvu de thiostrepton, on obtient des 
clones ayant perdu le plasmide pOSV508. Ces clones sont reperables par leur sensibilite 
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au thiostrepton. La sequence du gene cible delete peut etre verifiee par PCR et 
sequencage du produit PCR. 

Final ement, la souche resultante porte au niveau du gene inactive (deletion interne 
par exemple) un site att « cicatriciel » correspondant au site attB minimal (Raynal et aL, 
5 1998), issu de la recombinaison entre les sites attR et attL. Ce site attB minimal qui 
subsiste est semblable a celui present naturellement dans les souches de Streptomyces 
ambofaciens, Streptomyces pristinaespiralis et Streptomyces lividans (Sezonov et aL 9 
1997). 

Le gene que Ton veut inactiver peut etre cotranscrit avec d'autres genes situes en 
10 aval. Pour eviter que l'inactivation d'un des genes ait un effet polaire sur {'expression 
des genes en aval dans 1'operon, il est important d'obtenir une deletion en phase apres 
excision de*la cassette. Le systeme des cassettes excisables tel que decrit ci-dessus 
permet de repondre a une telle exigence. L'homme du metier pourra, en effet, aisement 
construire trois cassettes excisables distinctes, celles-ci laissant apres excision une 
15 sequence de 33, 34 ou 35 nucleotides respectivement. sans codon stop quelle que soit.la 
phase de lecture. Connaissant la sequence du gene cible et la taille de la deletion 
associee a V insertion de la cassette, il est possible de choisir entre ces trois cassettes 
excisables de fa<?on a ce que Texcision conduise a une deletion en phase. Sur les 33, 34 
ou 35 nucleotides rajoutes, 26 correspondent a la sequence attB minimale (cf. figure 27). 

20 Dans le cas de la presente demande, deux cassettes excisables ont ete utilisees. Ces 
deux cassettes sont les suivantes : attlQhyg+ (SEQ ID N° 91) et att3Qaac- (SEQ ID N° 
92), ces cassette laissent. respectivement 33 et 35 nucleotides apres excision. Elles 
comportent respectivement la cassette Qhyg ou la cassette Qaac, les signes + et — 
correspondant a l'orientation de la cassette de resistance, Ces deux cassettes ont ete 

25 construites et clonees au niveau du site EcoRV du vecteur pBC SK-f dont le site HindlU 
a ete suprime au prealable. Les plasmides obtenus ont ete nommes pattlf2hyg-f et 
patt3£2aac- respectivement. Les cassettes excisables peuvent etre facilement sorties par 
une digestion du plasmide par EcoRV. 
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EXEMPLE 10 : Construction d'une souche de Streptomyces ambof aciens 
interrompue dans le gene orf2 

- - L'inactivation du gene or/2 a ete realisee grace a la technique des cassettes 
excisables (cf. ci-dessus). La souche de depart utilisee est la souche Streptomyces 
ambofaciens OSC2 qui derive de la souche ATCC23877. Cependant la souche OSC2 
differe de la souche ATCC23877 en ce qu'elle a perdu 1'element genetique mobile 
P SAM2 (Boccard et al, 1989a et b). Cet element mobile peut etre perdu de maniere 
spontanee au cours de la protoplastisation (action du lysozyme pour digerer la paroi 
bacterienne et fragmenter le mycelium (Kieser et al, 2000)) et de la regeneration des 
protoplastes de la souche ATCC23877. Pour selectionner les clones ayant perdu 
1'element pSAM2, il a ete mis en place un crible, base sur la repression du gene pra par 
le represseur de transcription KorSA (Sezonov et al, 1995) (Sezonov G. et al, 2000). 
Pour cela, un fragment d'ADN contenant le promoteur du gene pra place en amont du 
gene aph (conferant la resistance a la kanamycine et depourvu de son propre promoteur) 
a ete clone dans le vecteur instable pWHM3Hyg, ce dernier derivant du plasmide 
P WHM3 (Vara et al., 1989) dans lequel le gene tsr a ete remplace par le gene hyg 
(conferant la resistance a Phygromycine). Le plasmide ainsi obtenu a ete nomme 
POSV510. La souche ATCC23877 a ete transformee apres protoplastisation par le 
plasmide pOSV510. Le promoteur Pra est un promoteur reprime par le represseur 
KorSA, le gene codant ce dernier etant sitae au sein de 1'element mobile P SAM2 
(Sezonov G. et al, 2000). Apres transformation par le plasmide pOSV510, les bacteries 
transformees sont selectionnees pour leur resistance a la kanamycine (due au gene aph 
porte par pOSV510). Les clones ayant perdu 1'element integratif pSAM2 ont perdu le 
represseur KorSA et le promoteur Pra n'est done plus reprime et permet 1'expression du 
gene de resistance a la kanamycine aph. Une selection par la kanamycine apres 
transformation par le plasmide pOSV510 permet done de selectionner les clones ayant 
perdu 1'element integratif pSAM2 (et done KorSA) et possedant le plasmide pOSV510. 
Le plasmide pOSV510 etant instable, apres quelques cycles de sporulation sans 
antibiotique, des clones isoles sont repiques sur milieu avec kanamycine, sur milieu avec 
hygromycine et sur milieu sans antibiotique. Les clones sensibles a la kanamycine et a 
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. rhygromj'cine ont perdu pOSV510. La perte de F element pSAM2 a ete verifiee par 
hybridation et PCR. Un clone presentant les caracteristiques souhaitees a ete selectionne 
et a ete nomrae OSC2. 

Un echantillon de la souche OSC2 a ete depose aupres de la Collection Nationale 
5 de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2908. 

L'inactivation du gene orf2 a. et6 realisee grace a la technique des cassettes 
excisables (cf. ci-dessus et figure 10). Pour cela, un insert de 4,5 kb dont la sequence 
10 part du site EcoKl situe en position 1 jusqu'au site BamBI situe en position 4521 „(SEQ 
ID N° 1) a ete sous-clone au niveau des sites EcoRl et BarnHl du plasmide pUC19 
(numero d'acces GenBank M77789) a partir du cosrnide pSPM5. Le plasmide ^ainsi 
obtenu a ete nomme pOS49.99. \ 

Ce plasmide a ete introduit dans la souche E. coli KS272 qui contenait deja le 
15 plasmide pKOBEG (Chaveroche et al> 2000) (cf figure 12). 

En parallel e, la cassette excisable att3Qaac- (SEQ ID N° 92, cf. ci dessus) a ete 
amplifiee par. PCR en utilisant comme matrice le plasmide pOSK1102 (Le plasmide 
pOSK1102 est un plasmide derive du vecteur pGP704Not (Chaveroche et aL, 2000) 
(Miller VL & Mekalanos JJ, 1988) dans lequel la cassette att3Qaac- a ete clonee comme 
20 un fragment EcoRV dans le site unique EcoKV de pGP704Not) et a l'aide des amorces 
suivantes : 

ORF2A 

5' CCCGCGCGGCAGCCTCTCCGTGATCGAGTCCGGCGTGACCJLTCGCGCGCGCTTCGTTCGG-3 1 (SEQ 
ID N° 93) 
25 ORF2B 

5 ' GCTCCGTGCGTCATGCAGGAAGGTGTCGTAGTCGCGGTAGATCTGCCTCTTCGTCCCGAA- 3 1 ( SEQ 
ID N° 94) 

Les 40 deoxy-nucleotides situes a Textremite 5' de ces oligonucleotides 
comportent une sequence correspondant a une sequence dans le gene cible {orf2 dans le 
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cas present) et les 20 deoxy-nucleotides situes le plus en 3' (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf. 
figure 11). 

Le produit de PGR ainsi obtenu a ete utilise pour transformer la souche E. coli contenant 
les plasmides pKOBEG et pOS49.99 comme decrit (Chaveroche et al, 2000) (cf. figure 
12). Ainsi, les bacteries ont ete transformees par electroporation et selectionnees pour 
leur resistance a l*apramycine. Les plasmides des clones obtenus ont ete extraits et 
digeres par plusieurs enzymes de restriction, dans le but de verifier que le profil de 
digestion obtenu correspond au profil attendu s'il y a eu insertion de la cassette 
{attSQaac-) dans le gene cible (or/2), c'est a dire si il y a bien eu recombinaison 
homologue entre les extremites du produit PCR et le gene cible (Chaveroche et ah, 
2000). La verification de la construction peut egalement etre realisee par toute methode 
connue de l'homme du metier et notamment par PCR en utilisant les oligonucleotides 
appropries et sequeneage du produit de PCR. Un clone dont le plasmide possede le 
profil attendu a ete selectionne et le plasmide correspondant a ete nomme pSPM17. Ce 
plasmide derive de pOS49.99 dans lequel or/2 est interrompue par la cassette 
apramycine (cf. figure 12). 

L'insertion de la cassette s'accompagne d'une deletion dans or/2, entre les nucleotides 
21 1 et 492 de la partie codante de or/2. 

Le plasmide pSPM17 a ete digere par I 'enzyme EcoRl puis les extremites ont ete 
rendues bout franc par traitement a 1' enzyme de Klenow, ce produit de digestion a ete 
ensuite digere par 1 'enzyme Xbal et 1 'insert contenant le gene or/2 delete a ete clone 
dans le vecteur pOSK1205 (cf. ci dessus). Pour cela, le vecteur pOSK1205 a ete digere 
par 1 'enzyme BamHl puis les extremites ont ete rendues bout franc par traitement a 
1'enzyme de Klenow, ce produit a ete ensuite digere par 1 'enzyme Xbal, et utilise pour la 
ligation avec l'insert obtenu a partir de pSPM17 comme ci-dessus. Cette manipulation 
permet done d'obtenir une ligation orientee puisque chacun des deux fragments est bout 
franc d'un cote et Xbal de I'autre. Le plasmide ainsi obtenu a ete nomme pSPM21, il 
porte un gene de resistance a lfcygromycine (partie vecteur) et un insert dans lequel le 
gene or/2 delete est remplace par la cassette attSQaac-. 
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Le vecteur pSPM21 a ete introduit dans la souche Streptomyces ambofaciens OSC2 
(cf. ci dessus) par transformation de protoplastes (Kieser. T et aL, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a rapramycine Les 
clones resistants a Papramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a Thygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene or/2 interrompu par la cassette att3Qaac-> Ces clones ont ete 
selectionnes et le remplacement de la copie sauvage de or/2 par la copie interrornpue par 
la cassette a ete verifie. La presence de la cassette att3Qaac- a ete verifiee par PCR sur 
colonie. Une hybridation a egalement ete effectuee. Pour cela, PADN total des clones 
obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere sur 
membrane et hybride avec une sonde de 3 kb correspondant a un fragment EcoRA- : , 
BamYLl de Pinsert du plasmide pOS49.99 (cf. ci-dessus). La verification du genotype f „ 
peut egalement etre realisee par toute methode connue de Thomme du metier et 
notamment par PCR en utilisant les oligonucleotides appropries et sequenpage du 
produit de PCR. 

Un clone presentant les caracteristiques attendues a ete selectionne et nomme 
SPM21. II a pu etre verifie grace a la PCR et a Phybridation que la cassette attSQaac- 
etait bien presente dans le genome de ce clone et que Pon obtient bien le profil de 
digestion attendu dans le cas d'un remplacement, a la suite d'un double evenement de 
recombinaison, du gene sauvage par la copie interrornpue par la cassette att3Qaac- dans 
le genome de ce clone. Ce clone possede done le genotype : orf2::at f 3Qaac-. 

Un echantillon de la souche SPM21 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2914. 
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La souche SPM21 a ete transformee par le vecteur pOS V508 par transformation de 
protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le plasmide 
pOSV508 est derive du plasmide pWHM3 (Vara J et a/., 1989) (cf. figure 13) dans 
lequel il a ete ajoute les genes xis et int de pSAM2 (Boccard F. et al, 1989b) place sous 
le controle du promoteur ptrc (Amann, E. et al, 1988) (cf. figure 14). L 'introduction 
dans la souche SPM21 du plasmide pOSV508 portant les genes xis et int de pSAM2 
permet l'excision efficace par recombinaison specifique de site de la cassette excisable 
entre les sites attL et attR flanquant cette cassette (Raynal A. et al, 1998) (figure 10). 
Parmi les transformants selectionnes pour leur resistance au thiostrepton due au gene tsr 
porte par pOSV508, on choisit ceux devenus sensibles a I'apramycine dont le gene de 
resistance est porte par la cassette att3£2aac-, l'excision entrame en effet la perte de ce 
gene de resistance (cf. figure 10). Le plasmide pOSV508 est instable et apres deux 
passages successifs sur milieu sans antibiotique des clones isoles sont repiques sur 
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles ,au 
thiostrepton ont perdu pOSV508. II a ete verifie que l'excision de la cassette aboutit bien 
a une deletion en phase dans le gene or/2 par PCR et sequencage du produit PCR, 
l'excision de la cassette laisse en effet une sequence « cicatricielle » att3 caracteristique 
(qui est similaire au site attB d'origine apres recombinaison entre les sites attL et attR) : 

5' ATCGCGCGCGCTTCGTTCGGGACGAAGAGGCAGAT 3' (SEQ ID N° 95). 

La souche ainsi obtenue et possedant le genotype voulu (or/2::att3) a ete nommee 
SPM22. 

Un echantillon de la souche SPM22 a ete depose aupres de la Collection Nationale 
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement I- 
2915. 
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EXEMPLE 11 : Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orfl2 

Pour Tinactivation de orfl2 z orflSc et orfl4 un meme plasmide de depart 
(pSPM504) a ete employe pour introduire a differentes positions une cassette de type 
5 « cassette excisable ». Ce plasmide possede un insert de 15,1 kb qui correspond a la 
region de or/7 a or/17. Pour construire ce plasmide un fragment Bglll de 1 5,1 kb 
provenant de la digestion du cosmide pSPM7 (cf. ci-dessus) a ete clone dans le plasmide 
pMBL18 (Nakano et al, 1995) digere par BamHL. Les extremites BamYLl et Bgltt etant 
compatibles, on obtient apres ligation, le plasmide pSPM502. La totalite de 1'insert de 
10 pSPM502 a ensuite ete sous-clone (sous forme d'un fragment HindUUNheT) dans le 
plasmide pOSK.1205 (digere par HindWNheT) ce qui a permis d'obtenir le plasmide 
pSPM504. 

Ce plasmide a ete introduit dans la souche E. coli KS272 qui contenait deja le ;' 
plasmide pKOBEG (Chaveroche et al, 2000) (cf. figure 12). 

15 En parailele, la cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant 

comme matrice le plasmide pOSKl 102 (le plasmide pOSKl 102 est un plasmide derive 
du vecteur pGP704Not (Chaveroche et ah, 2000) (Miller VL & Mekalanos J J, 1988) 
dans lequel la cassette att3Qaac- a ete clonee comme un fragment EcoRV dans le site 
unique EcoRV de pGP704Not), les amorces utilisees sont les suivantes : 

20 EDR8 : 5 ' CGGGATGATCGCTTGTCCGGCGGCCGGATGCCTAGCCTCATCGCGCGCGCTTCGTTCGG 3 ' 
(SEQ ID N° 96) 

EDR9 : 5 ' CCCGATCCAGAACGTCTGGTCGGTGATCAGGTCGCTGTTC&TCTGCCTCTTCGTCCCGAA 3 ' 
(SEQ ID N° 97) 

25 Les 40 (seulement 39 pour EDR8) deoxy-nucleotides situes a Textremite 5' de 

ces oligonucleotides comportent une sequence correspondant a une sequence dans le 
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gene cible (prfl2 dans le cas present) et les 20 deoxy-nucleotides situes le plus en 3' 
(figure en gras ci-dessus) correspondent a la sequence d'une des extremites de la cassette 
excisable attSQaac- (cf. figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et al. (Chaveroche et al, 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM507). Ainsi, les bacteries ont ete transformees par electroporation 
par ce produit de PCR et les clones ont ete selectionnes pour leur resistance a 
1'apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette {att3Qaac-) dans le gene 
cible {or/12), c'est a dire si il y a bien eu recombinaison homologue entre les extremites 
du produit PCR et le gene cible (Chaveroche et al, 2000). La verification de la 
construction peut egalement etre realisee par toute methode connue de l'homme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequencage 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 
et le plasmide corresponds a ete nomme pSPM507. Ce plasmide derive de pSPM504 
dans lequel or/72 est interrompue par la cassette att3Qaac- (cf. figure 12). L'insertion de 
la cassette s'accompagne d'une deletion dans le gene or/12, 1 'interruption commence au 
niveau du trentieme codon de or/12. II reste apres la cassette les 46 derniers codons de 
or/12. 

Le vecteur pSPM507 a ete introduit dans la souche Streptomyces ambo/aciens OSC2 
(cf. ci-dessus) par transformation de protoplastes (Kieser, T et al, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a 1'apramycine. Les 
clones resistants a 1'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a 1'apramycine (ApraR) et sensibles a 1'hygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene or/12 interrompu par la cassette attSQaac-. Ces clones ont ete plus 
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parti culierement selectionnes et le rernplacement de la copie sauvage de or/12 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, l'ADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette ati3Qaac- pour 
5 verifier la presence de la cassette dans l'ADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant comme sonde un fragment d'ADN 
obtenu par PCR et correspondant a une tres large partie de la sequence codante du gene 
or/12. 

La verification du genotype peut egalement etre realisee par toute methode connue de 
10 l'homme du metier et notamment par PCR en utilisant les oligonucleotides appropries et 
sequen9age du produit de PCR. 

Un clone presentant les caracteristiques attendues (or/12::att3Qaac-) a ete plus 
particulierement selectionne et nomme SPM507. II a pu en effet etre verifie grace.gux 
deux hybridations que la cassette attSQaac- etait bien presente dans le genome de ce 

15 clone et que Ton obtient bien le profil de digestion attendu dans le cas -d^un 
rernplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette attSQaac- dans le genome de ce clone. Ce clone 
possede done le genotype : or/12: :att3Qaac~ et a ete nomme SPM507. II est inutile de 
proceder a l'excision de la cassette pour Petude de Peffet de l'inactivation de or/12, au 

20 vu de 1 'orientation des genes (cfi figure 3). En effet, le fait que or/1 3c soit oriente en 
sens oppose a or/12 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une 
cassette excisable permet en revanche d'avoir la possibility de se debarrasser du 
mai*queur de selection a tout moment, notamment par transformation par le plasmide 
pOSV508. Un echantillon de la souche SPM507 a ete depose aupres de la Collection 

25 Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur 
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 
1-2911. 
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EXEMPLE 12: Construction d'une souche de Streptomyces ambofadens 
interrompue dans le gene orfl3c 

La cassette excisable at&Qaac- a ete ampTifiee par PCR en utilisant comme 
matrice le plasmide pOSKl 102 (cf. ci-dessus) a l'aide des amorces suivantes : 



EDR3 : 5 ' ACCGGGGCGQTCCTCCCCTCCGGGGCGTCACGGCCGCGGAATCTGCCTCTTCGTCCCG&A 3 ■ 
(SEQ. ID N° 98) 

. EDR4:5' CACGCAGCGAGCCGACGCACTGATGGACGACACGATGGCCATCGCGCGCGCTTCGTTCGG 3' 
(SEQ ID N° 99) 

Les 40 deoxy-nucleotides situes a 1'extremjte 5' de ces oligonucleotides comportent 
une sequence correspondant a une sequence dans le gene cible (orfl3c dans le cas 
present) et les 20 deoxy-nucleotides situes le plus en 3' (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf. 
figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et al. (Chaveroche et al., 2000) (cf. figure 12 pour le principe, le plasmide 
pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM508). Ainsi, les bacteries ont ete transformees par electroporation 
par le produit de PCR et les clones ont ete selectionnes pour leur resistance a 
l'apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-) dans le gene 
cible (or/7 3c), c'est a dire si il y a bien eu recombinaison homologue entre les extremites. 
du produit PCR et le gene cible (Chaveroche et al, 2000). La verification de la 
construction peut egalement etre realisee par toute methode connue de 3'homme du 
metier et notamment par PCR en utilisant les oligonucleotides appropnes et sequencage 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 
et le plasmide correspondant a ete nomine pSPM508. Ce plasmide derive de pSPM504 
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dans lequel orfl3c est interrompue par la cassette apramycine (cf. figure 12). L'insertion 
de la cassette s'accompagne d'une deletion dans le gene orfl 3c, rinterruption commence 
au niveau du sixierne codon de orfl 3c. II reste apres la cassette les 3 derniers codons de 
orfl 3c. 

Le vecteur pSPM508 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et aL, 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a 1'apramycine. Les 
clones resistants a P apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a l'hygromycine (HygS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene or/J 3c interrompu par la cassette att3Qaac-. Ces clones ont ete plus 
parti culierement selectionnes et le remplacement de la copie sauvage de orfl 3c ]Dar la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, l'ADN total des 
clones obtenus, a ete digere par plusieurs enzymes, separe sur gel d'agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- v pour 
verifier la presence de la cassette dans PADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant cornme sonde un produit de PCR 
correspondant a une sequence debordant d'une centaine de paires de base en amont et en 
aval de la sequence codante de orfl 3c. La verification du genotype peut egalement etre 
realisee par toute methode connue de rhomme du metier et notamment par PCR en 
utilisant les oligonucleotides appropries et sequen?age du produit de PCR. 

Un clone presentant les caracteristiques attendues {orfl3c::aU3Qaac- y ) a et6 plus 
particulierement selectionne et nomme SPM508. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement a la suite d'un double evenement de recombinaison ; du gene sauvage par 
la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
possede done le genot) / pe : orfl3c::att3Qaac- et a ete nomme SPM508. II est inutile de 
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proceder a 1'excision de la cassette pour 1'etude de l'effet de l'inactivation de or/1 3c, au 
vu de l'orientation des genes (cf. figure 3), le fait que orfl4 soit oriente en sens oppose a 

l r ^l™^l. 5 Ue F n _?£ ^ s .°. nt .m c o-trans crits. L'utilisation d;une cassette, 
excisable permet en revanche d'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Un echantillon de la souche SPM508 a ete depose aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue 
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero 
d'enregistrement 1-2912. 



10 EXEMPLE 13 Construction d'une souche de Streptomyces ambofaciens 

interrompue dans le gene or/74 

La cassette excisable att3Qaac- a ete amplifiee par PCR en utilisant comme 
matrice le plasmide pOSKl 102 (cf. ci-dessus) a I'aide des amorces suivantes : 

EDR5 : 5 'GGGCGTGAAGCGGGCGAGTGTGGATGTCATGCGAGTACTCATCGCGCGCGCTTCGTTCGG 3 ' 
15 (SEQ ID N° 100) 

EDR6 : 5 • CGGGAAACGGCGTCGCACTCCTCGGGGGCCGCGTCAGCCCATCTGCCTCTTCGTCCCCAA 3 < 
(SEQ ID N° 101) 



Les 40 deoxy-nucleotides situes a l'extremite 5' de ces oligonucleotides component 
0 une sequence correspondant a une sequence dans le gene cible (or/14 dans le cas 
present) et les 20 deoxy-nucleotides situes le plus en 3 1 (figure en gras ci-dessus) 
correspondent a la sequence d'une des extremites de la cassette excisable att3Qaac- (cf. 
figure 11). 

Le produit de PCR ainsi obtenu a ete utilise pour transformer la souche E. coli 
KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme decrit par 
Chaveroche et al. (Chaveroche et al, 2000) (cf. figure 12 pour le principe, le plasmide 
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pOS49.99 doit etre remplace par le plasmide pSPM504 et le plasmide obtenu n'est plus 
pSPM17 mais pSPM509). Ainsi, les bacteries ont ete transformees par electroporation 
par le produit de PCR et les clones ont ete selectionnes pour leur resistance a 
I'apramycine. Les plasmides des clones obtenus ont ete extraits et digeres par plusieurs 
enzymes de restriction, dans le but de verifier que le profil de digestion obtenu 
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-) dans le gene 
cible {prfl4\ c'est a dire si il y a bien eu recombinaison homologue entre les extremites 
du produit PCR et le gene cible (Chaveroche et al 9 2000). La verification de la 
construction peut egalement etre realisee par toute methode connue de rhomme du 
metier et notamment par PCR en utilisant les oligonucleotides appropries et sequen9age 
du produit de PCR. Un clone dont le plasmide possede le profil attendu a ete selectionne 
et le plasmide correspondant a ete nomme pSPM509. Ce plasmide derive de pSPM504 
dans lequel or/14 est interrompu par la cassette apramycine (cf figure 12). L'insertion de 
la cassette s'accompagne d'une deletion dans le gene or/74, Pinterruption commence au 
niveau du quatrieme codon de or/14. H reste apres la cassette le dernier codon de or/14. 

V* 

Le vecteur pSPM509 a ete introduit dans la souche Streptomyces ambo/aciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et aL y 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a Tapramycine. Les . 
clones resistants a l'apramycine sont ensuite repiques respectivement sur milieu avec 
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A) (cf. figure 
9). Les clones resistants a Tapramycine (ApraR) et sensibles a Thygromycine (HygS) 
sont en principe ceux'ou un double evenement de crossing over s'est produit et qui 
possedent le gene or/14 interrompu par la cassette att3Qaac~. Ces clones ont etc plus 
particulierement selectionnes et le remplacement de la copie sauvage de or/14 par la 
copie interrompue par la cassette a ete verifie par hybridation. Ainsi, PADN total des 
clones obtenus. a ete digere par plusieurs enzymes, separe sur gel d 5 agarose, transfere 
sur membrane et hybride avec une sonde correspondant a la cassette att3Qaac- pour 
verifier la presence de la cassette dans PADN genomique des clones obtenus. Une 
deuxieme hybridation a ete effectuee en utilisant comme sonde un produit de PCR 
correspondant a une sequence debordant d'une centaine de paires de base en amont et en 
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aval de la sequence codante de orfl.4. La verification du genotype peut egalement etre 
realisee par toute methode connue de l'homme du metier et notamment par PCR en 
utilisant les oligonucleotides appropries et sequen?age du produit de PCR. 

Un clone presentant les caracteristiques attendues {orfl 4 : : attS Qaac-) a ete plus 
particulierement selectionne et nomme SPM509. II a pu en effet etre verifie grace aux 
deux hybridations que la cassette att3Qaac- etait bien presente dans le genome de ce 
clone et que Ton obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette att3Qaac- dans le genome de ce clone. Ce clone 
-possede done le genotype : orfl4::att3Qaac- et a ete nomme SPM509. II est inutile de 
proceder a 1'excision de la cassette pour F etude de I' effet de l'inactivation de or/74, au 
vu de r orientation des genes (cf. figure 3), le fait que or/7 5c soil oriente en sens oppose 
a orf!4 montre que ces genes ne sont pas co-transcrits. L'utilisation d ? une cassette 
excisable permet en revanche d'avoir la possibilite de se debarrasser du marquexor de 
selection a tout moment. Un echantillon de la souche SPM509 a ete depose aupres de la 
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue 
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numero 
d * enregistrement 1-29 1 3 . 



EXEMPLE 14: Construction d'une souche de Streptomyces ambofaciens 
interrompue dans le gene orf6* 

L'inactivation du gene or/6* a ete realisee grace a la technique des cassettes 
excisables (cf. ci-dessus et figure 10). Pour cela, le cosmide pSPM7 a ete utilise comme 
matrice pour amplifier un fragment du gene orf6* grace aux oligonucleotides suivants : 

C9583 : 5' CTGCAGGTGCTCCAGCGCGTCGATCT 3' (oligo sens) (SEQ ID N° 102) 
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C9584 : 5' CTGCAGACGGAGGCGGACCTGCGGCT 3' (oligo antisens) (SEQ ID hl° 
103) 

Les 20 deoxy-nucleotides situes a l'extremite 3' de ces oligonucleotides 
correspondent a une sequence situee dans la partie codante du gene or/6* (SEQ ID N° 
13) et les 6 deoxy-nucleotides situes les plus en 5' correspondent a la sequence d'un site 
Pstl permettant de faciliter le clonage par la suite. Le fragment d'ADN amplifie fait une 
taille d'environ 1,11 kb. Ce produit de PCR est clone dans le vecteur pGEM-T Easy 
(commercialise par la societe Promega (Madison, Wisconcin, USA)) ce qui a permis 
d' obtenir le plasmide nomme pBXL 1111 (cf. figure 16). 

La cassette excisable attlQhyg+ a ensuite ete introduite dans la sequence codante 
du gene orf6*. Pour cela, le plasmide pBXLllll a ete digere par les enzymes de 
restriction Smal et AspllZl et le produit de digestion a ete traite par l'enzyme de 
Klenow. Cette manipulation permet de realiser une deletion interne de 120 pb dans la! 
sequence codante du gene orf6* (cf. figure 15). De plus, de part et d'autre des sites de 
restrictions, il reste respectivement 511 pb et 485 pb de la sequence de or/6* qut 
permettront la recombinaison homologue pour Finactivation du gene or/6*. La cassette 
excisable attlOhyg+ a ete preparee a partir du plasmide pattlQhyg+ (cf. ci-dessus) par 
digestion de ce plasmide par EcoKV. Cette derniere a ensuite ete sous-clonee dans le 
vecteur pBXLllll prealablement prepare comme decrit ci-dessus (digestion Smal et 
AspllSl puis traitement a l'enzyme de Klenow). Le plasmide obtenu a ete nomme 
pBXLl 1 12 (cf. figure 17). Dans cette construction, le gene orf6* comporte une deletion 
de 1 20pb et est interrompu par la cassette attWhyg+. 

Le plasmide pBXL1112 a ete ensuite digere par l'enzyme Pstl (site bordant la 
cassette puisque present dans les oligonucleotides PCR) et l'insert Pstl de 3.7 kb 
comprenant une partie de orf6* interrompu par la cassette atUf2hyg+ a ensuite ete clone 
au niveau du site Pstl du plasmide pOJ260 (cf. ci-dessus). Le plasmide ainsi obtenu a ete 
nomme pBXLl 113. 
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Le vecteur pBXLl 113 a ete introduit dans la souche Streptomyces ambofaciens 
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al. % 2000). Apres 
transformation, les clones sont selectionnes pour leur resistance a rhygromycine. Les 
clones resistants a rhygromycine sont ensuite repiques respectivement sur milieu avec 
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A) (cf. figure 
9). Les clones resistants a Thygromycine (HygR) et sensibles a Tapramycine (ApraS) 
sont en principe ceux ou un double evenement de crossing over s'est produit et qui 
possedent le gene orf6* interrompu par la cassette attlOhyg+. Ces clones ont ete plus 
particulierement selectionnes et le remplacement de la copie sauvage de orf6* par la 
copie interrompue par la cassette a ete verifie par la technique du Southern blot. Ainsi, 
PADN total des clones obtenus, a ete digere par plusieurs enzymes, separe sur gel 
d' agarose, transfere sur membrane et hybride avec une sonde correspondant au gene hyg 
(obtenu par PCR) pour verifier la presence de la cassette dans PADN genomique des 
clones obtenus. Une deuxieme hybridation a ete effectuee en utilisant comme sonde 
P insert Pstl-Pstl contenant le gene orf6*, d'une taille d'environ 1,1 kb et obtenu a partir 
du plasmide pBXLllll (cf. ci-dessus et figure 16). La verification du genotype pent 
egalement etre realisee par toute methode connue de Thomme du metier et notamment 
par PCR en utilisant les oligonucleotides appropries et sequen9age du produit de PCR. 

Un clone presentant les caracteristiques attendues (prf6*: :attl Ohyg+) a ete 
plus particulierement selectionne et oomme SPM501. II a pu en effet etre verifie grace 
aux deux hybridations que la cassette attl£2hyg+ etait bien presente dans le genome de 
ce clone et que 1'on obtient bien le profil de digestion attendu dans le cas d'un 
remplacement, a la suite d'un double evenement de recombinaison, du gene sauvage par 
la copie interrompue par la cassette attl£2hyg+ dans le genome de ce clone. Ce clone 
possede done le genotype : orf6*::attlQhyg+ et a ete nomme SPM501. Un echantillon 
de la souche SPM501 a ete depose aupres de la Collection Nationale de Cultures de 
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 
15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2909. 
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La souche SPM501 a ete transformee par le vecteur pOSV508 par transformation 
de protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le plasmide 
pOSV508 est derive du plasmide pWHM3 (Vara J et aZ.,1989) (cf. figure 13) dans 
lequel les genes xis et int. de pSAM2 (Boccard F. et al, 1989b) places sous le controle 

5 du promoteur ptrc (Amann, E. et al, 1988) ont ete ajoutes (cf. figure 14). L' introduction 
dans la souche SPM501 du plasmide pOSV508 portant les genes xis et int de pSAM2 
permet l'excision efficace par recombinaison site specifique de la cassette excisable entre 
les sites attL et attR flanquant cette cassette (Raynal A. et al, 1998) (figure 10). Parmi 
les transformants, selectionnes pour leur resistance au thiostrepton due au gene tsr porte 

10 par pOSV508, on choisit ceux devenus sensibles a l'hygromycine dont le gene de 
resistance est porte par la cassette attlQhyg+, l'excision entraine en effet la perte de ce 
gene de resistance (cf. figure 10). Le plasmide pOSV508 est instable et apres deux 
passages successifs sur milieu sans antibiotique des clones isoles sont repiques sur 
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles,. au 

15 thiostrepton ont perdu pOSV508. II a ete verifie que l'excision de la cassette a bien eu 
lieu en phase dans le gene or/6* par PCR et sequencage du produit PCR. L' interruption 
commence au 158 ,imc codon, 40 codons sont deletes (120pb) et l'excision de la cassette 
laisse une sequence « cicatricielle » attl caracteristique de 33pb : ^ 5' 
ATCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N° 104). 

20 La souche ainsi obtenue et possedant le genotype voulu (pr/6*::attJ) a ete nommee 
SPM502. 

Un echantillon de la souche SPM502 a ete depose aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 
Paris Cedex 15, France, le 10 juillet 2002 sous le numero d'enregistrement 1-2910. 
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EXEMPLE 15 : Analyse des souches de Streptomyces ambofaciens 
interrompue dans les genes orf2, orf3, orfS, orflO, or/22, orf!3c, orfI4, orf6* 

Pour tester la production en spiramycine des diverses souches obtemies, un test 
microbiologique base sur la sensibilite d'une souche de Micrococcus luteus a ete mis au 
5 point (cf. (Gourmelen A. et al^ 1998)). La souche de Micrococcus luteus utilisee est une 
souche derivee de la souche DSM1790 naturellement sensible a la spiramycine (cette 
souche est disponible notamment aupres de la German Collection of Microorganisms 
and Cell Cultures (Deutsche Sammlung von Mikro-organismen und Zellkulturen GmbH, 
DSMZ), (Braunschweig, Ailamagne), sous le numero DSM1790), la souche utilisee 

10 dans le present test differe de la souche DSM1790 en ce qu'elle est resistante a la 
congocidine. Cette souche est un mutant spontane obtenu par selection sur milieu 
contenant des doses croissantes de congocidine. Une telle souche a ete selectionnee du 
fait que Streptomyces ambofaciens produit a la fois de la spiramycine et de la 
congocidine. Le but etant de doser la production en spiramycine des diverses souches 

15 obtenues grace a un test microbiologique base sur la sensibilite d'une souche de 
Micrococcus luteus, il est necessaire de disposer d'une souche resistante a la 
congocidine. 

Les differentes souches de Streptomyces a tester ont ete cultivees dans des 
erlenmeyers a baffles (erlenmeyers chicanes) de 500 ml contenant 70 ml de milieu MPS 

20 (Pernodet et aL, 1993). Les erlenmeyers chicanes ont ete inocules a une concentration 
initiale de 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et mises a 
pousser a 27°C sous agitation orbitale de 250 rpm. Des prelevements de 2 ml de 
suspensions ont ete realises apres 48, 72 et 96 heures de culture et centrifuges. Les 
differents surnageants ont ensuite ete congeles a -20°C. Une dilution au dixieme de ces 

25 surnageants dans du milieu de culture sterile est utilisee pour le test (cf. figure 1 8). 

La souche indicatrice de Micrococcus luteus resistante a la congocidine mais 
sensible a la spiramycine a ete cultivee dans du milieu 2TY (Sambrook et aL, 1989) 
contenant de la congocidine a 5 [ig/ml pendant 48h a 37°C. La densite optique (DO) de 
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la culture est mesuree et cette culture est diluee de facon a ajuster la densite optique a 4. 
0,4 ml de cette pre-culture est dilue dans 40 ml de milieu DAMS (Difco Antibiotic 
Medium 5, commercialise par la societe Difco), prealablement porte a une temperature 
d'environ 45°C. Ce milieu est ensuite coule dans une boite carree de 12x12 cm et laisse 
5 a reposer a temperature ambiante. 

Une fois le milieu refroidi et solidifie, des disques en papier Whatman AA (cf. 
Gourmelen A. et aL, 1998) de 12 mm de diametre ont ete imbibes de 70 1 de la dilution 
au dixieme de chaque surnageant et deposes sur la surface de la boite. Des disques 
imbibes d'une solution de spiramycine de differentes concentrations (2-4-8 jxg/ml dans 
10 du milieu de culture MPS) sont utilises comme gamme etalon. Les boites sont laissees a 
4°C pendant 2 h de fa?on a permettre la diffusion des antibiotiques dans Tagar puis sont 
incubees a 3 7°C pendant 24 a 48h. 

Si le disque contient de la spiramycine, celle-ci diffuse dans Fagar et inhibe la 
croissance de la souche indicatrice de Micrococcus luteus. Cette inhibition cree un 

15 « halo » autour du disque, ce halo refletant la zone ou la souche de Micrococcus hiteus 
n'a pas pousse. La presence de ce halo est done une indication de la presence de 
spiramycine et permet de determiner si la souche de S. ambofaciens correspondant au 
disque en question est productrice ou non productrice de spiramycine. Une comparaison 
avec les diametres d'inhibition obtenus pour la gamme etalon permet d'obtenir une 

20 indication de la quantite de spiramycine produite par cette souche. 

Les differentes souches decrites dans les exemples precedents ont ete utilisees 
dans ce test pour detecter leur production en spiramycine. Les resultats obtenus ont ete 
regroupes dans le Tableau 33. 
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Tableau 33 



Souche 


Gene inactive 










lequel la 

3UUwllt cat 

decrite 


Producteur (+) ou 
xiun-pruQiicieur ^-j ae 
spiramycine 


ATCC23877 


Aucun 


1 


(+) 


OS49.16 


orf3::£2hyg 


2 


(-) 


OS49.67 


orf3 deletion en phase 


6 


(-) 


OS49.107 


orf8\\Qhyg 


7 


(-) 


OS49.50 


or/10:: Qhyg 


8 


(-) 


OSC2 


Aucun 


10 


(+) 


SPM21 


orf2::att3Qaac- 


10 


(-) 


SPM22 


orf2::att3 deletion en phase 


10 


(-) 


SPM501 


orf6*::attinhyg+ 


14 


(-) 


SPM502 


orf6*::attl deletion en phase 


14 


(+) 


SPM507 


orfl 2::att3£2aac- 


11 


(-) 


SPM508 


orfl3c::ati.3Qaac~ 


12 


(+) 


SPM509 


orfl4::att3Qaac- 


13 


(-) 



..Ces resultats permettent de tirer un certain nombre de conclusions en ce qui 
concerne la fonction des differents genes impliques dans la biosynfhese de la 
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spiramycine. Ainsi le gene or/3 est essentiel a la biosynthese de la spiramycine. En effet 
une inactivation en phase dans ce gene conduit a une souche (OS49.67, (cf. exemple 6)) 
ne produisant plus de spiramycine. L'inactivation en phase permet d'ecarter l'hypothese 
d'une eventuelle influence de la cassette introduite sur V expression des genes situes en 
5 aval de or/3. 

De meme, les genes or/8 et orflO codent des proteines essentielles a la biosynthese 
de la spiramycine puisque les souches OS49.107 et OS49.50 ont un phenotype non 
producteur. De plus, dans ces deux dernieres souches, c'est bien l'inactivation du gene 
correspondant qui est responsable de ce phenotype non producteur, puisqu'au vu de 
10 l'orientation des differentes orfs (cf. figure 3), la construction introduite ne peut avoir 
d' effet polaire. 

L' etude des souches possedant une cassette excisable permet egalement de tirer un 
certain nornbre de conclusion en ce qui concerne la fonction des genes interrompus. La 
souche SPM507 possede le genotype : orfl2::att3Qaac-. II est inutile de proceder a 
l'excision de la cassette pour l'etude de r effet de 1'inactivation de or/12, au vu de 
l'orientation des genes (cf figure 3). Le fait que orfl3c soit oriente en sens oppose a 
or/12 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM507 est non producteur, on 
peut done en conclure que le gene or/12 est un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens . 

La souche SPM508 possede le genotype: orfl3c::att3£2aac-. n est inutile de . 
proceder a 1' excision de la cassette pour l'etude de 1' effet de 1'inactivation de or/1 3c, au 
vu de l'orientation des genes (cf figure 3). Le fait que orfl4 soit oriente en sens oppose 
25 a or/13c montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d 'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM508 est producteur, on peut 



15 
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done en conclure que le gene orfl 3c n'est pas un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. 

La souche SPM509 possede le genotype: orfl4::att3Qaac-. II est inutile de 
proceder a P excision de la cassette pour P etude de P effet de reactivation de orfl 4, au 
vu de P orientation des genes (cf. figure 3), le fait que orflSc soit oriente en sens oppose 
a orfl4 montre que ces genes ne sont pas co-transcrits. L'utilisation d'une cassette 
excisable permet en revanche d'avoir la possibility de se debarrasser du marqueur de 
selection a tout moment. Le phenotype de la souche SPM509 est non producteur, on 
peut done en conclure que le gene orfl4 est un gene essentiel a la biosynthese de la 
spiramycine chez S. ambofaciens. 

La souche SPM21 possede le genotype : orfl::att3Qaac-. Le phenotype de cette 
souche est non producteur de spiramycines. Cependant, P orientation des genes orfl a 
orfS (cf. figure 3) iaisse penser que ces genes sont cotranscrits. Aussi, le phenotype 
observe peut etre du a un effet polaire de la cassette introduce dans orfl sur 1 5 expression 
de genes situes en aval dans Poperon. La souche SPM22 possede le genotype orf2::att3 
et a ete obtenue apres excision en phase de la cassette introduite. L'excision de la 
cassette laisse seulement une sequence « cicatricielle » caracteristique (cf. exemple 10). 
La souche SPM22 etant egalement de phenotype non producteur, on peut en conclure 
que le gene orf2 est un gene essentiel a la biosynthese de la spiramycine chez S. 
ambofaciens. On observe ici uniquement P effet du a Pinactivation de orfl. 

La souche SPM501 possede le genotype : orf6*;:attlQhyg+. Le phenotype de 
cette souche est non producteur de spiramycines. Cependant, les genes orf5* et orfS* 
(cf. figure 3) ayant la meme orientation, le phenotype observe peut etre du a un effet 
polaire de la cassette introduite dans orf6* sur Pexpression de orfS* La disposition de 
ces genes laisse penser qu ; ils peuvent etre cotranscrits. Pour repondre a cette question, la 
souche SPM502 a ete obtenue apres excision en phase de la cassette introduite. Dans 
cette souche, on observe uniquement P effet de Pinactivation de or/6* Cette souche 
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possede le genome orf6*::attl (cf. exemple 14). L'excision de la cassette laisse 
seulement une sequence « cicatricielle » en phase (cf. exemple 14). La souche SPM502 
possede un phenotype producteur (cette souche ne produit cependant que de la 
spiramycine I (cf*. exemple 16)). On peut done conclure que le gene orfi* est un gene 
5 essentiel a la biosynthese de la spiramycine chez S. ambofaciens, puisque son 
inactivation indirecte dans la souche SPM501 conduit a un phenotype non producteur. 
Par contre ; le gene or/6* n'est pas un gene essentiel a la biosynthese de la spiramycine I 
chez S. ambofaciens (par contre il est essentiel a la production de spiramycine II et III 
(cf. exemple 16)). 

10 ..... 

EXEMPLE 16. Dosage de la production des spiramycines I, II et III dans les. 
souches mutantes obtenues ^ 

Les differentes souches a tester ont ete cultivees chacune dans 7 erlensmeyers 
chicanes de 500 mL contenant 70 ml de milieu MPS (Pernodet et aL, 1993). Les erlens 
15 ont ete inocules par 2.5 10 6 spores/ml des differentes souches de S. ambofaciens et 
mises a pousser a 27°C sous agitation orbitale de 250 rpm pendant 72 heures. Les 
cultures correspondant au meme clone sont rassemblees, eventuellement filtrees sur 
filtre plisse, et centrifugees 15 min a 7000 tr/min. Les differents surnageants ont ensuite 
ete stockes a -30°C. 

20 Les dosages ont ete effectues par Chromatographic Liquide a Haute Performance 

(CLHP) par appariement d'ions. L' analyse CLHP du milieu de culture permet de 
determiner precisement la concentration des trois formes de spiramycine. La colonne 
utilisee (Macherey-Nagel) est remplie avec une phase Nucleosil de silice greffee octyle. 
La granulometrie est de 5jam et la taille des pores 100A. Le diametre interne de la 

25 colonne est de 4,6mm et sa longueur 25cm. La phase mobile est un melange de tampon 
H3PO4 (pH2 ? 2) et d'acetonitrile 70/30 (v/v) contenant 6 5 25g/L de perchlorate de 
NaC10 4 . U analyse est realisee en regime isocratique avec un debit fixe a 1 mL/min. La 
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colonne est thermoregulee a 23 °C. La detection est assuree par spectrophotometrie UV 
a 238nm. L'echantillon est reftigere a +1 0°C et la quantification est determinee a partir 
de Paire des pics (par etalonnage externe). Dans ces conditions, les temps de retention 
de la spiramycine I. II et III sont respectivement d' environ 17; 21 et 30 minutes, comme 
il a pu etre verifie grace a un echantillon commercial comprenant les trois formes de 
spiramycine. 

La souche OSC2 possede un phenotype producteur de spiramycine. C'est la 
souche parentale utilisee pour l'obtention des souches possedant une cassette excisable 
(cf exemple 15). Cette souche a done ete utilisee comme temoin positif de production 
des trois- formes de spiramycine. Cette souche produit bien les trois formes de 
spiramycines comme il a ete verifie par CLHP (cf figure 19). 

L ? etude des souches possedant une cassette excisable permet de tirer un certain 
nombre de conclusions en ce qui concerne la fonction des genes interrompus. La souche 
SPM507 possede le genotype : orfl2::att3Qaac~. Le phenotype de la souche SPM507 
est non producteur (cf. exemple 15), on peut done en conclure que le gene orfl2 est un 
gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. Cette souche ne 
produit plus de spiramycines comme il a ete verifie par CLHP (cf figure 22). Ce resultat 
confirme le caractere essentiel du gene orfl2 dans la biosynthese de la spiramycine. 

La souche SPM508 possede le genotype : orfl3c::ati.3Qaac~. Le phenotype de la 
souche SPM508 est producteur de spiramycine (cf exemple 15), on peut done en 
conclure que le gene orflSc n'est pas un gene essentiel a la biosynthese de la 
spiramycine chez & ambofaciens. Cette souche produit de la spiramycine I, II et III 
comme il a ete verifie par CLHP (cf figure 23). Ce resultat confirme que le gene orfl 3c 
n'est pas un gene essentiel a la biosynthese des spiramycines I, II et III ches S. 
ambofaciens. 

La souche SPM509 possede le genotype : orfl4::ati3Qaac-. Le phenotype de la 
souche SPM509 est non producteur, on peut done en conclure que le gene oifl4 est un 
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gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens. Cette souche ne 
produit plus de spiramycins comme il a ete venfie par CLHP (cf. figure 24). Ce resultat 
confirme 1'essentialite du gene orfl4 dans la biosynthese de la spiramycine. 

La souche SPM501 possede le genotype : orf6*::attIQhyg+. Le phenotype de 
cette souche est non producteur de spiramycines. Cette souche ne produit plus de 
spiramycines comme il a ete verifie par CLHP (cf. figure 20). Cependant, les genes 
orf5* et orf6* (cf. figure 3) ayant la meme orientation, le phenotype observe peut etre du 
a un effet polaire de la cassette introduite dans orf6* sur 1' expression de orf5* dans 
Poperon. Ceci laisse penser que ces genes sont cotranscrits. Pour repondre a cette 
question, la souche SPM502 a ete obtenue par excision de la cassette introduite, 
produisant une deletion en phase dans le gene or6* et restaurant Pexpression de orfS*. 
Cette souche possede le genotype orf6*::attl (cf. exemple 14 et 15). U excision de la 
cassette laisse seulement une sequence att « cicatricielle » en phase (cf. exemple 14). La ! 
souche SPM502 possede un phenotype producteur de spiramycine. Cependant, comme il 
a ete prouve par CLHP, cette souche ne produit que de la spiramycine I et ne produit pas' 
de spiramycine II et III (cf. figure 21). On peut done conclure de ces resultats que le 
gene or/5* est un gene essentiel a la biosynthese de la spiramycine chez S. ambofaciens, 
puisque son inactivation indirecte dans la souche SPM501 conduit a un phenotype non 
producteur de spiramycine (cf. figure 20). Par contre ; le gene orf6* n'est pas un gene 
essentiel a la biosynthese de la spiramycine I chez S. ambofaciens, puisque l'inactivation 
de ce gene conduit a un phenotype producteur de spiramycine I (cf. figure 21). 
Cependant, orf6* est essentiel a la production de spiramycine II et III (cf. exemple 16)). 
Le gene orf6* code done bien une acyl -transferase responsable de la modification du 
platenolide a la position 3 (cf. figure 1). 
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Liste des constructions decrites dans la presente demande 



Liste des abreviations : Am : Ampicilline ; Hyg: Hygromycine ; Sp : Spiramycine ; Ts 
Thiostrepton ; Cm : Chloramphenicol. Kn : Kanamycine, Apra : apramycine. 



Norn de 1 
construction 


a Marqueur 
de selection 


Principales caracteristiques 


Reference 


pWE15 


Am 




(WahL etal, 1987) 


pWEDl 


Am 


pWE15 dans lequel ui 
fragment Hpal-Hpal de 4. I kt 
a ete delete 


i fGourmelen pf nl 
> 1998) 


pOJ260 


Apra 


Conjugatif non replicatif chez 
Streptomyces 


] (Bierman pt nl 
1992) 


pHP45 Qhyg 


Hyg 


Cassette Qhyg dans pHP45. 


fBlonde1 et-R nnanlf 
e/a/., 1997) 


pKC505 


Apra 


Cosmide 


(Richardson MA 
a/., 1987) 


pIJ486 


Ts 


Plasmide replicatif 
multicopies Streptomyces 


(Ward pt nl 1 


pOSint3 


Am 


ptrc-xis-int dans pTrc99A 




pWHM3 


Am, Ts 


Vecteur navette replicatif E, 
coli/Streptomyces. 


(VaraeZa/., 1989) 


pKOBEG 


Cm 




(Chaveroche et al, 
2000) 


pGP704Not 


Am 




(Chaveroche e£ al, 
2000) 


pMBL18 


Am 




(Nakano a/., 
1995) 


pGEM-T Easy 


Am 


vecteur E. coli pour clonage 
de produits PCR 


Mezei et al., 1994 
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pub4y. l 


Am 


pWEDl avcc insert au niveau 
du site BamHl 


Exemple 2 


pOS49.11 


Am 


Fragment Sad de pOS49.1 
dans pUUiy. 


Exemple 2 


pOSC49.12 


Ch 


Fragment XJiol de pOS49.11 
dans pot 


Exemple 2 


pOS49.14 


Cm , Hyg 


pOSC49.12 avec le gene or/3 
interrompu par la cassette 
Unyg 


Exemple 2 


pOS49.16 


Apra, Hyg 


Insert de pOS49.14 dans 
pOJ260 


Exemple 2 


P OS49.28 


Cm 


Fragment BarriEl-Pstl de 
3,7kb de pOS49.i dans pBC 
SK+ 


Exemple 3 


pOS44.1 


Apra, Sp 


pKC505 contenant un insert 
conferant la resistance la 
spiram3'cine chez S, 
griseofuscus 


(Pernodet a/., 
1999) 


pOS44.2 


Ts ; Sp 


Fragment Sati3Al de 1,8 kb 
pUS44.I dans pIJ45o 


Exemple 3 


pOS44.4. 


Am 


Insert de pOS44.2 dans 
pUCT9 


Exemple 3 


pbrM5 


Am 


pwbUl avec insert d AUN de 
S. ambofaciens au niveau du 
site BamHI 


Exemple 3 


pSPM7 


Am 


pWEDl avec insert d'ADN de 
S. ambofaciens au niveau du 
site BamHl 


Exemple 3 
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pOSK1205 


Hyg 


pBK-CMV dans lequel hy± 
remplace neo 


I Exemple 5 


pOS49.67 


Apra 


Fragment EcoKl-Sacl - de 
pOS49.1, comportant xmt 
deletion interne de 504 
nucleotides, dans pOJ260 


5 Exemple 6 

l 


pOS49.88 


Am 


Fragment de 3.7 kb Psth 
EcoRl de pOS49.1 dans 
pUC19 


Exemple 7 


pOS49.106 


Am 


p04g.88 avec hyg dans orf8 
(hyg et or/8 dans la meme 
orientation) 


Exemple 7 


pOS49.120 


Am 


pOS49.88 avec hyg dans or/8 
(hyg et or/8 dans des 
orientations opposees) 


Exemple 7 


pOS49.107 


Apra, Hyg 


Insert de pOS49.106 dans 
pOJ260 


Exemple 7 


pOS49.32 


Am, Kn 


Fragment de 1,5 kb interne a 
orflO dans pCR2.1-TOPO 


Exemple 8 


pOS49.43 


Am, Kn 


pOS49.32 avec hyg dans orflO 
(hyg et or/10 dans la meme 
orientation) | 


Exemple 8 


pOS49.44 


Am, Kn 


pOS49.32 avec hyg dans orflO 
(hyg et orflO dans des 
orientations opposees) 


Exemple 8 


pOS49.50 


Apra, H)'g 


Insert de pOS49.43 dans 
pOJ260 


Exemple 8 | 


pWHM3H 3 'g 


Am, Hyg 


pWHM3 dans lequel tsr est 
remplace par hyg 


Exemple 1 0 
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pOSV508 


Am, Ts 


ptrc-xis-int dans pWHM3 


Exemple 9 


pattlQhyg+ 


Cm 5 Hyg 


Cassette attlQhyg+ dans pBC 
SK+ dont le site HindlU a ete 
supprime 


Exemple 9 


patt3Qaac- 


Cm, Gn 


Cassette att3^aac- dans pBC 
SK+ dont le site HindlU a ete 
supprime 


Exemple 9 


pOSV510 


Am, Hyg 


pro pra-Amh dans 
pWHM3Hyg 


Exemple 10 


pOS49.99 


Am 


Fragment EcoRl-BamUl de 
4,5 kb de pSPM5 dans pUC19 


Exemple 10 


P OSK1102 


Am, Apra 


pGP704Not contenant la 
cassette attSQaac- 


Exemple 10 


pSPM17 


Am, Apra 


pOS49.99 dans lequel or/2 est 
interrompue par la cassette 
attSQaac- 


Exemple 10 


pSPM21 


Hyg, Apra 


pOSK1205 contenant V insert 
EcdRl-Xbal de pSPM17 (dans 
lequel orf2 .est interrompue 
par la cassette att3Qaac~) 


Exemple 10 


pSPM502 


Am 


Fragment BgUl de 15,1 kb de 
pSPM7 dans pMBL18 


Exemple 1 1 


pSPM504 


Hyg 


Insert de pSPM502 dans 
pOSK1205 


Exemple 1 1 


pSPM507 


Hyg, Apra 


pSPM504 dans lequel or/12 
est interrompue par la cassette 
attSQaac- 


Exemple 1 1 


pSPMSOS 


Hyg, Apra 


pSPM504 dans lequel orfl3c 
est inten*ompue par la cassette 
aitSQaac- 


Exemple 12 
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pSPM509 



pBXLllll 



PBXL1112 



PBXL1113 



ffyg, Apra 



Am 



Am, Hyg 



pSPM504 dans lequel orfl4 
est interrompue par la cassette 
att3Qaac- 



Fragment de 1,11 kb 
contenant oif6* amplifie par 
PGR a partir de pSPM7 5 dans 
le vecteur pGEM-T Easy 



Exemple 13 



Exemple 14 



pBXLllll dans lequel la 
cassette attJQhyg+ a etc 
introduite apres deletion de 
120 pb dans la sequence 
codante du gene orf6* 



Exemple 14 



Apra, Hyg Insert Pstl de 3.7 kb de 
pBXL1112 dans pOJ260 



Exemple 14 
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Depot de materiel bioiogique 

Les organismes suivants out ete deposes le 10 juillet 2002 aupres de la Collection 
Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724 
Paris Cedex 15, France, selon les dispositions du Traite de Budapest. 

5 - Souche OSC2 sous le numero d'enregistrement 1-2908. 

Souche SPM501 sous le numero d'enregistrement 1-2909. 

Souche SPM502 sous le numero d'enregistrement 1-2910. 

Souche SPM507 sous le numero d'enregistrement 1-29 1 1 . 

Souche SPM508 sous le numero d'enregistrement 1-2912. 

10 - Souche SPM509 sous le numero d'enregistrement 1-2913. 

Souche SPM21 sous le numero d'enregistrement 1-2914. 

Souche SPM22 sous le numero d'enregistrement 1-2915. 

Souche OS49.67 sous le numero d'enregistrement 1-2916. 

Souche OS49.107 sous le numero d'enregistrement 1-291 7. 

15 - Souche Escherichia Coli DH5a contenant le plasmide pOS44.4 sous le numero 

d'enregistrement 1-29 1 8. 
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REVENDICATffONS 

1. Polynucleotide codant un polypeptide implique dans la biosynthese des 
spiramycins caracterise en ce que la sequence dudit polynucleotide est : 

(a) Pune des sequences SEQ ID N° 3, 5, 7, 9, 1 1, 13, 15, 17, 19, 21, 23, 25, 28, 
30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 

(b) Tune des sequences constitutes par les variants des sequences (a), 

(c) 1'une des sequences derivees des sequences (a) et (b) en raison de la 
degenerescence du code genetique. 

2. Polynucleotide s'hybridant dans des conditions d 'hybridation de forte 
stringence a au moins l'un des polynucleotides selon la revendication 1. 

3. Polynucleotide presentant au moins 70%, 80%, 85%, 90%, 95% ou 98% 
d'identite en nucleotides avec un polynucleotide comprenant au moins 10, 12, 15, 18, 
20 a 25, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 
600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 
1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 
nucleotides consecutifs d'un polynucleotide selon la revendication 1. 

4. Polynucleotide selon la revendication 2 ou 3 caracterise en ce qu'il est isole 
a partir d'une bacterie du genre Streptomyces. 

5. Polynucleotide selon la revendication 2, 3 ou 4 caracterise en ce qu'il code 
une proteine impliquee dans la biosynthese d'un macrolide. 

6. Polynucleotide selon la revendication 2, 3, 4 ou 5 caracterise en ce qu'il 
code une proteine ayant une activite similaire a la proteine codee par le polynucleotide 
avec lequel il s'hybride ou il presente 1'identite. 
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7. Polypeptide resultant de I'expression d'un polynucleotide selon la 
revendication 1, 2, 3, 4, 5 ou 6. 

8. Polypeptide implique dans la biosynthese des spiramycines caracterisee en 
ce que la sequence dudit polypeptide est : 

(a) Tune des sequences SEQ ID N° 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 
27, 29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 
61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83 et 85, 

(b) Tune des sequences telles que definies en (a) excepte que tout au long de 
ladite sequence un ou plusieurs acides amines ont ete substitues, inseres ou deletes 
sans en affecter les proprietes fonctionnelles, 

(c) Tune des sequences constitutes par les variants des sequences (a) et (b). 

9. Polypeptide presentant au moins 70%, 80%, 85%, 90%, 95% ou 98%^ 
d'identite en acides amines avec un polypeptide comprenant au moins 10, 15, 20. 30 a 
40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340,;- 
360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560, 580, 600, 620 ou 640 acides 
amines consecutifs d'un polypeptide selon la revendication 8. 

10. Polypeptide selon la revendication 9 caracterise en ce qu'il est isole a partir 
d'une bacterie du genre Streptomyces . 

11. Polypeptide selon la revendication 9 ou 10 caracterise en ce qu'il code une 
proteine impliquee dans la biosynthese d'un macrolide. 

12. Polypeptide selon la revendication 9, 10 ou 1 1 caracterise en ce qu'il a une 
activite similaire a celle du polypeptide avec lequel il partage 1'identite. 

13. ADN recombinant caracterise en ce qu'il comprend au moins un 
polynucleotide selon l'une des revendications 1, 2, 3, 4, 5 ou 6. 
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14. ADN recombinant selon la revendication 13 caracterise en ce que le dit 
ADN recombinant est compris dans un vecteur. 

15. ADN recombinant selon la revendication 14 caracterise en ce que ledit 
vecteur est choisi parmi les bacteriophages, les plasmides, les phagemides, les 
vecteurs integratifs, les fosmides, les cosmides, les vecteurs navettes, les BAG ou les 
PAC. 

16. ADN recombinant selon la revendication 15 caracterise en ce que ledit 
vecteur 'est choisi* parmi pOS49.1/ pOS49.11, pOSC49.12 ? - pOS49.14, pOS49.16 ? 
pOS49.28, pOS44.1, pOS44.2 5 pOS44.4, pSPM5, pSPM7, pOS49.67 ? pOS49.88 5 
pOS49.106 5 pOS49.120 5 pOS49.107 5 pOS49.32 5 pOS49.43, pOS49.44, pOS49.50 ; 
pOS49.99, pSPM17, pSPM21, pSPM502 5 pSPM504 ? pSPM507, pSPM508, 
pSPM509 5 pSPMl, pBXLl 111, pBXLl 1 12 et pBXLl 113. 

17. Vecteur d'expression caracterise en ce qu'il comprend au moins une 
sequence d'acide nucleique codant un polypeptide selon la revendication 7, 8, 9, 10, 
11 ou 12. 

18. Systeme d'expression comprenant un vecteur d'expression approprie et 
une cellule hote permettant 1 5 expression d'un ou plusieurs polypeptides selon la 
revendication 7 5 8, 9, 10, 1 1 ou 12. 

19. Systeme d'expression selon la revendication 18 caracterise en ce qu'il est 
choisi parmi les systemes d'expression procaryotes ou les systemes d'expression 
eucaryotes. 

20. Systeme d'expression selon la revendication 19 caracterise en ce qu'il est 
choisi parmi les systemes d'expression chez la bacterie E. coli, les sytemes 
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d 5 expression baculo virus permettant ime expression dans des cellules d'insectes, les 
sytemes d'expression permettant une expression dans des cellules de levures, les 
sytemes d'expression permettant une expression dans des cellules de mammiferes. 

21. Cellule bote dans laquelle a ete introduit au moins un polynucleotide et/ou 
au moins un ADN recombinant et/ou au moins un vecteur d'expression selon Tune des 
revendications 1, 2, 3, 4, 5, 6, 13, 14, 15, 16 ou 17. 

22. Procede de production d'un polypeptide selon la revendication 7, 8, 9, 10, 
1 1 ou 12 caracterise en ce que ledit procede comprend les etapes suivantes: 

a) inserer au moins un acide nucleique _ codant ledit polypeptide dans un 
vecteur approprie ; 

. b) cultiver, dans un milieu de culture approprie, une cellule hote prealablement 
transformee ou transfectee avec le vecteur de l'etape a) ; ^ 

c) recuperer le milieu de culture conditionne ou un extrait cellulaire; 

d) separer et purifier a partir dudit milieu de culture ou encore a partir : de 
Pextrait cellulaire obtenu a l'etape c), ledit polypeptide ; 

e) le cas echeant, caracteriser le polypeptide recombinant produit. 

23. Microorganisme bloque dans une etape de la voie de biosynthese d'au 
moins un macrolide. 

24. Microorganisme selon la revendication 23 caracterise en ce qu'il est obtenu 
en inactivant la fonction d'au moins une proteine impliquee dans la biosj^nthese de ce 
ou de ces macrolides dans un microorganisme producteur de ce ou de ces macrolide. 

25. Microorganisme selon la revendication 24 caracterise en ce que 
Tinactivation de cette ou de ces proteines est effectuee par mutagenese dans le ou les 
genes codant ladite ou lesdites proteines ou par expression d'un ou de plusieurs ARN 
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anti-sens complementaires de TARN ou des ARN messagers codant ladite ou lesdites 
proteines. 



26. Microorganisme selon la revendication 25 caracterise en ce que 
l'inactivation de cette ou de ces proteines est effectuee par mutagenese par irradiation, 
par action d'agent chimique mutagene, par mutagenese dirigee ou par remplacement 
de gene. 

27. Microorganisme selon la revendication 25 ou 26 caracterise en ce que la ou 
les mutageneses sont effectuees in vitro ou in situ, par suppression, substitution, 

T deletion fet/ou addition d r une ou'plusieurs bases' dans le ou les genes consideres ou par 
inactivation genique. 

28. Microorganisme selon la revendication 23, 24, 25, 26 ou 27 caracterise en 
ce que ledit microorganisme est une bacterie du genre Streptomyces , 

29. Microorganisme selon la revendication 23, 24, 25, 26, 27 ou 28 caracterise 
en ce que le macrolide est la spiramycine. 

30. Microorganisme selon la revendication 23, 24, 25, 26, 27, 28 ou 29 
caracterise en ce que ledit microorganisme est une souche de S. ambofaciens. 

31. Microorganisme selon la revendication 23, 24, 25, 26, 27, 28, 29 ou 30 
caracterise en ce que la mutagenese est effectuee dans au moins un gene comprenant 
une sequence selon l:une des revendication 1, 2, 3, 4, 5 ou 6. 

32. Microorganisme selon la revendication 25, 26, 27, 28, 29, 30 ou 31 
caracterise en ce que la mutagenese est effectuee dans un ou plusieurs genes 
comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ 
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ID N° 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 
60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84. 

33. Microorganisme selon la revendication 25, 26, 27, 28, 29, 30, 31 on 32 
caracterise en ce que la mutagenese consiste en l'inactivation genique d'un gene 
comprenant une sequence correspondant a la sequence SEQ ID N° 13. 

34. Souche de Streptomyces ambofaciens caracterisee en ce qu'il s'agit d'une 
souche choisie parmi Tune des souches deposees aupres de la Collection Nationale de 
Cultures de Microorganismes (CNCM) le 10 juillet 2002 sous le numero 
d'enregistrement 1-2909, 1-2911, 1-2912, 1-2913, 1-2914, 1-2915, 1-2916 ou 1-2917, 

35. Procede de preparation d'un intermediaire de biosynthese de macrolide 
caracterise en ce qu'il comprend les etapes suivantes : 

a) cultiver, dans un milieu de culture approprie, un microorganisme selon Tune 
des revendications 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33 ou 34, 

b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
l'extrait cellulaire obtenu a Tetape b), ledit intermediaire de biosynthese. 

36. Procede de preparation d'une molecule derivee d'un macrolide caracterise 
en ce que Ton prepare un intermediaire de biosynthese selon le procede de la 
revendication 35 et que Ton modifie 1' intermediaire ainsi produit. 

37. Procede de preparation selon la revendication 36 caracterise en ce que Ton 
modifie ledit intermediaire par voie chimique, biochimique, enzymatique et/ou 
microbiologique. 
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38. Procede de preparation selon la revendication 36 oxx 37 caracterise en ce 
que Ton introduit dans ledit microorganisme un ou plusieurs genes codant des 
proteines susceptibles de modifier I'intermediaire en s'en servant comnie substrat. 

39. Procede de preparation selon la revendication 36, 37 on 38 caracterise en 
ce que le macrolide est la spiramycins 

40. Procede de preparation selon la revendication 36, 37, 38 ou 39 caracterise 
en ce que le microorganisme utilise est une souche de S. ambofaciens . 

41. Microorganisme produisant de la spiramycine I mais ne produisant pas de 
spiramycine II et III 



42. Microorganisme selon la revendication 41 caracterise en ce qu'il comprend 
r ensemble des genes necessaires a la biosynthese de la spiramycine I mais que le gene 
comprenant la sequence SEQ ID N° 13 ou 1'un de ses variants ou l'une des sequences 
derivees de celles-ci en raison de la degenerescence du code genetique et codant un 
polypeptide de sequence SEQ ID N° 14 ou Tun de ses variants n'est pas exprime ou a 
ete rendu inactif. 

43. Microorganisme selon la revendication 42 caracterise en ce que la dite 
inactivation est realisee par mutagenese dans le gene codant ladite proteine ou par 
P expression d ? un ARN anti-sens complementaire de l'ARN messager codant ladite 
proteine. 

44. Microorganisme selon la revendication 43 caracterise en ce que la dite 
mutagenese est effectuee dans le promoteur de ce gene, dans la sequence codante ou 
dans une sequence non codante de maniere a rendre inactive la proteine codee ou a en 
empecher son expression ou sa traduction. 
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45. Microorganisme selon la revendication 43 ou 44 caracterise en ce que la 
mutagenese est effectuee par irradiation, par action d 5 agent chimique mutagene, par 
mutagenese dirigee ou par remplacement de gene. 

5 46. Microorganisme selon la revendication 43 5 44 ou 45 caracterise en ce que 

la mutagenese est effectuee in vitro ou in situ, par suppression, substitution, deletion 
et/ou addition d'une ou plusieurs bases dans le gene considere ou par inactivation 
genique. 

10 47. Microorganisme selon la revendication 41 ou 42 caracterise en ce que ledit 

microorganisme est obtenu en exprimant les genes de la voie de biosynthese de la 
spiram}'cine sans que ceux-ci ne comprennent le gene comprenant la sequence 
conrespondant a SEQ ID N° 13 ou Tun de ses variants ou 1'une des sequences derivees 
de celles-ci en raison de la degenerescence du code genetique et codant un po^^pe^tide 

15 de sequence SEQ ID N° 1 4 ou Tun de ses variants. 

48. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46 ou 47 
caracterise en ce que ledit microorganisme est une bacterie du genre Streptomyces. 

20 49. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47 ou 48 

caracterise en ce que ledit microorganisme est obtenu a partir d'une souche de depart 
produisant les spiramycin es I, II et EI. 

50. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47, 48 ou 49 
25 caracterise en ce qu'il est obtenu par mutagenese dans un gene comprenant la 
sequence correspondent a SEQ ID N° 13 ou Tun de ses variants ou Tune des 
sequences derivees de celles-ci en raison de la degenerescence du code genetique et 
codant un polypeptide de sequence SEQ ID N° 14 ou l'un de ses variants ayant la 
meme fonction. 



30 



1er depot 



148 

51. Microorganisme selon la revendication 41, 42, 43, 44, 45, 46, 47, 48, 49 on 
50 caracterise en ce que ledit microorganisme est obtenu a partir d'une souche de S. 
ambofaciens produisant les spiramycines I, II et III, dans laquelle est effectuee une 
inactivation genique du gene comprenant la sequences correspondant a SEQ ID N° 13 
ou Tune des sequences derivees de celle-ci en raison de la degenerescence du code 
genetique. 

52. Souche de S. ambofaciens caracterisee en ce qu'il s'agit de la souche 
deposee aupres de la Collection Nationale de Cultures de Microorganismes (CNCM) 
le 10 juillet 2002 sous le numero d'enregistrement 1-2910. 

53. Procede de production de spiramycine I, caracterise en ce qu'il comprend 
les etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon 
Tune des revendi cations 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 ou 52, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
P extrait cellulaire obtenu a Petape b) 5 la spiramycine I. 

54. Utilisation d'un polynucleotide selon Pune des revendications 1, 2, 3, 4, 5 
ou 6 pour ameliorer la production en macrolides d'un microorganisme. 

55. Microorganisme mutant producteur de macrolide caracterise en ce qu'il 
possede une modification genetique dans au moins un gene comprenant une sequence 
selon Pune des revendication 1, 2, 3, 4, 5 ou 6 et/ou qu'il surexprime au moins un 
gene comprenant une sequence selon Pune des revendication 1, 2, 3, 4, 5 ou 6. 

56. Microorganisme mutant selon la revendication 55 caracterise en ce que la 
modification genetique consiste en une suppression, une substitution, une deletion 
et/ou une addition d'une ou plusieurs bases dans le ou les genes consideres dans le but 
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d'exprimer une ou des proteines ayant une activite superieure ou d'exprimer un 
niveau plus eleve de cette ou de ces proteines. 

57. Microorganisme mutant selon la revendication 55 caracterise en ce que la 
5 surexpression du gene considere est obtenue en augmentant le nombre de copie de ce 

gene et/ou en plagant un promoteur plus actif que le promoteur sauvage. 

58. Microorganisme mutant selon la revendication 55 ou 57 caracterise en ce 
que la surexpression du gene considere est obtenue en transformant un 

10 microorganisme producteur de macrolide par une construction d'ADN recombinant 
selon la revendication 13, 14 ou 17, permettant la surexpression de ce gene. 

59. Microorganisme mutant selon la revendication 55, 56, 57 ou 58 caracterise 
en ce que la modification genetique est effectuee dans un ou plusieurs genes 

15 comprenant une des sequences correspondant a une ou plusieurs des sequences SEQ 
ED N° 3, 5, 7 5 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 
60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82 et 84 ou Pun de ses variants ou l'une des 
sequences derivees de celles-ci en raison de la degenerescence du code genetique. , 

20 60. Microorganisme mutant selon la revendication 55, 56, 57, 58 ou 59. 

caracterise le microorganisme surexprime un ou plusieurs genes comprenant une des 
sequences correspondant a une ou plusieurs des sequences SEQ ID N° 3, 5, 7, 9, 11, 
13, 15, 17, 19, 21, 23, 25, 28, 30, 34^, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 
72, 74, 76, 78, 80, 82 et 84 ou Tun de ses variants ou l'une des sequences derivees de 

25 celles-ci en raison de la degenerescence du code genetique. 

61. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59 ou 60 
caracterise en ce que ledit microorganisme est une bacteries du genre Streplomyces . 
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62. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59, 60 on 61 
caracterise en ce que le macrolide est la spiramycins. 

63. Microorganisme mutant selon la revendication 55, 56, 57, 58, 59, 60, 61 ou 
62 caracterise en ce que ledit microorganisme est une souches de S. ambofaciens. 

64. Procede de production de macrolides, caracterise en ce qu'il comprend les 
etapes suivantes : 

(a) cultiver, dans un milieu de culture approprie, un microorganisme selon 
l 5 une des revendications 55, 56, 57, 58, 59, 60, 61, 62, 63 ou 64, 

(b) recuperer le milieu de culture conditionne ou un extrait cellulaire, 

(c) separer et purifier a partir dudit milieu de culture ou encore a partir de 
1' extrait cellulaire obtenu a l'etape b), le ou lesdits macrolides produits. 

65. Utilisation d'une sequence efou d'un ADN recombinant et/ou d'un vecteur 
selon l'une des revendication 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 ou 17 
pour la preparation d'antibiotiques hybrides. 

66. Utilisation d'au moins un polynucleotide et/ou au moins un ADN 
recombinant et/ou au moins un vecteur depression et/ou au moins un polypeptide 
et/ou au moins une cellule hote selon l'une des revendications 1, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12 13, 14, 15, 16, 17ou21 pour realiser une ou plusieurs byconversions. 

67. Polynucleotide caracterise en ce qu'il s'agit d'un polynucleotide 
complementaire de Tun des polynucleotides selon la revendication 1, 2, 3, 4, 5, ou 6. 
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FASTA (3.42 Sept 2001) function [optimized, BL50 matrix (I5:-5)] 
ktup: 2 join: 37, opt: 25, open/ext: -10/-2, width: 16 

Smith- Waterman score: 1467; 63.13 0% identity (66.480% ungapped) in 
377 aa overlap (3-367:11-380) 

10 20 30 40 

orf 3 MTIPFLD AGAGYRELRAEIDAALQRVSASGRYLIjDAELAAFESEFAA 



tylB MTGLPRPAVRVPFHDLRDVHAATG VESEIGGALLRVAARGRYLLGAELAAFEERFAE 

10 20 30 40 50 

50 60 70 80 90 100 
orf 3 YCDITOHCVAVGSGCDALELSLRALDIGPGDEVWPAHTFIGTWLAVSATGARPVAV 



tylB YCGNAHCVAVGSGLDDARLALWALGVGEGDEVIVPSRTFIASWLAVSATGATPVPVEPGD 
60 70 80 90 100 110 



110 120 130 140 150 160 

orf 3 - - DPT PDGL SLDPALVE AALT PRTRALMPVHLHGH PADLD PLL AI AGRHGLAVVED AAQA 



tylB . PGEPGPGAFLLDPDRLEAALTPRTRAVMPVHLYGHPTOLDPVGAFAEPHGLAWEDAAQA 
120 130 140 150 . 160 170 

170 180 190 200 210 220 

orf 3 HGARYRGRRIGSGHWAFSFYPGKlNn^GAMGDGGAVVTGDSGVAERXRLLRNCGSREPvYRH 



tylB T-ARYRGRRIGSGHRTAFSFYPGKNLGALGDGGAVVTSDPELADRLRLLRNYGAREKYRH 
180 190 200 210 220 230 

230 240 250 260 270 280 

orf 3 EVRSTH SRLDEFQAA VTiRAKL PRLDAWNARRAGTAERYGRAi,GPVPQ I AVP VTAPWADPV 



tylB EERGTNSRLDELQAAVLSVKLPYLDAWNTRRREIAARYGEALAGLPGVWP-EGRVAEPV 
240 250 260 270 280 290 

290 300 .310 320 330 340 

orf 3 WHLYVX RC AERDELRRRLERAG VQTL I H Y PVP PHRS P AYADDPAGA - PAGTK PL S ERLAA 



tylB WHQYVLR S P YRDPJ^RRRIj AE AGVETLVH YPVAVHASGAYAG - - AG PC PAGGL PPAERL.AG 
300 310 320 330 . 340 350 

350 360 370 380 

orf 3 QSLSLPLGPHLGEDEARAWAAVRAASAGLAAYPTPDGQRFPLVTEKR 



:ylB E VTj SL P I G PHL PDE AVE WI AAVQ S AALD S WEEG P 
360 370 380 
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<110> AVENTIS PKARMA SA 
CNRS 



LISTE DE SEQUENCES 



POLYPEPTIDES IMPLIQOES DANS LA BIO SYNTH E SE DES 
SPIRAMYCINS, SEQUENCES WCLEOTIDIQUES COD^ C*S 
POLYPEPTIDES ET LEURS APPLICATIONS 

<13 0> Biosynthese spiramycins 



<140> 
<141> 

<160> 105 

<17 0> Patentln Ver. 2.1 

<210> 1 
<211> 30943 
<212> ADN 

<213> Streptomyces ambof aciens 

if 

<400> 1 



£££££ tcgtS££ -ggcacgcc attccgacca cggcaacggc 60 

gttcgccgS ccacgcc^a Ic^ttT^ g *?* tctcca ^acctgca tccctcatat 120 
gcgaactgcc gggcSSgg Eaacco^ Cttttcttga tcttcccgag cgtacagcgg 180 
attgtccacc g^tctcgt? gaaCgaCaat "attgtgtc aagttcggag 240 

gcaccaggtc cgcagggK gcgctccaac ' atgc Srgsacc acacggcatc 3 00: 

gcacgcggag tcctgggcgf gcggagafaa tt^?^ gtCgCgcact <=cggtgacct 360 
ttcgcgacga atatg^agg tclotlcalo ca^f ^ tCgCggCgCg ^acaaccac 420 
gcgcccgtcc cgctccgcS oj ?S * 9 ° Cgccccgccc tgacccgtcc 480 

gtgtcaggtt cgccttScca ctc ^cgga atttcagtcg gcagctcatt 54 0 

ccggaaccac cStgccJcS otSJScc? ™ ttCcta ^tctgccg gtaaccggga 600 
ggtgaggccg tgacgggacc gatgSactS f CaCCgCtt ttcgagg ^ fc ecgactgatg 660 
gagtggttcg cgtacScag alcaaaftf, agCaaggacg cggacgcccg ggggctgctt 720 
tggcaggtct tcgactacaa cTJtf * cc ^tgttct gggacgagac ccgacaggcg 780 
tcggac^tca acKgtgK SgaSa ^Jf?" gca gttcttctcS 840 

acgatcggcg cgctggaccc gcccacSca^ " CSraac ^ ^tgatcat cggtccgggc 900 
ttcacccccc gacggftcgc StS ggaCCgat ^ c ^caagctggt gagccaggcg 960 
ctggacaagg Lggacagca ggacg^atc ? CCagggtgC ^cgatcac cgaggagctc 1020 
ccggtcatcg tg^acS JctaSa^ gaCgCc ^ gtgacctgtc ctacgcgctg 1080 
gagtgggtcg aLccctgct JacgaaSS iT^ ^cgaccgtga cctgttccgg 1140 
ttcaccgaga cgatcgcgcc cgSctcIaa aCCCgaacct cccggacaac 1200 

cacgccaagc gggacgcgcc Sccaacaar 9a9 \ tgaCCg actacctcct gaagcagatc 1260 
gacggccgcc ggrtgaccga ^ ggtca f 9 Srgctggtcca ggcggagcag 1320 

gggcacgtct StcLoS cctS?agc a'SS ^ . tCgCgCtgCt ^gacggcg "80 
caggcgctgg aggacc^gcg ggcStcS tccctSr tggtCCtgga ^gaacccg 1440 
ctgcgctacc gcaccccctt Sacaac-fr S^^^ Ccggcgc ^t cgaggagacg 1500 
ctcggtccgc tca^ggag^a Sgccaaa^a aS" f tcaaggagga caccaccgtc 1560 
gacccccggc actt^ccgga cccgaialca ? S SW^cagtc cgccaaccgg 1620 
cacatggcct tcgggcacSg catSccac lattln ? gCCgCtc ^ a ^ggcacccgg 1680 
ggcaaggtca tgctcgaaS cctcctoaac llnntn" 9 CCgccctc ^ ccgcctggag 1740 
cacaccgtgt tStacgaggc Sccaactc ^cttccgcat cgaccacgag 1800 

tggaactgaa cccgaggSc S cc l a ^cgaagt acctgcccgt ccgggtcgac 1860 
ctcacgaccg cccga^^g aSccgcca ""^ gtCCC ^c SBCcctggac 1920 

ggcgggtcag caagatra™ cfaSSS^ ^^a* caca ^cgag ctccctgccc 1980 
gcggcagc^t et«gtS aagtc^g tEcSaaJ CgagC3gCaC -tcgacccgc 2040 
actacatgca tggccagacc clatctlc-t ^ ^ Cttcccc 9 tc cgacgcgtct 2100 

tggaacaact cgTcat^gcc c'Xa^cg "StS? cS"S CaCCgcaccc 216 ° 

ttccccccaL caccctcgac gacggcttcc 2220 
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agcacgccac ctaccgtctg gacgaacccg gagccggact ctgcatcggc cccatggtcf. 22 80 
ggcgcgtcct gaaggacttc gaccccgaca ccgtggccct ggtcctcgcc tcgcagcact 2340 
acgaggagtc cgactactac cgcgactacg acaccttcct gcatgacgca cggagcctca 2400 
catgaccatc cccttcctcg acgcgggcgc cggctaccgg gagttgcgag ccgagatcga 2 460 
cgcggccctg cagcgggtgt ccgcctccgg ccgctatctg ctcgacgcgg aactcgcggc 2 52 0 
cttcgaggag gagttcgccg cgtactgcga caacgaccac tgtgtggcgg tgggcagtgg 2 580 
ctgcgacgcg ctggagctgt ccctgcgggc gctggacatc ggtcccgggg acgaggtggt 2 64 0 
ggtgcccgcg cacaccttca tcgggacctg gctggccgtg tccgctaccg gggcacggcc 2700 
ggtggccgtc gacccgacgc cggacgggct ctccctcgac ccggcgctgg tggaggcggc 27 60 
gctcacccct cggaccagag ccctgatgcc ggtgcacctg cacgggcacc cggccgacct 2 82 0 
cgacccgcta ctggcgatcg ccggacggca cggcctggcc gtggtcgagg acgccgcgca 2 880 
ggcccacggc gcccgttacc ggggccgcag gatcggctcg ggccacgtgg tcgcgttcag 2940 
cttctacccc ggcaagaacc tcggcgccat gggggacggc ggcgcggtgg tcacgggtga 3 000 
ctccggtgtg gccgagcgga tccggttgct gcgcaactgc ggctcgcggg agaagtaccg 3060 
gcacgaggtg cgctcgaccc actcccggct cgacgagttc caggcggccg tgctgcgggc 312 0 
caaactgccg cggctcgacg cgtggaacgc ccgccgggcc ggcacggccg aacggtacgg 3180 
gcgggccctg ggtccggtac cgcagatcgc cgtcccggtc accgctccct gggccgaccc 3240 
ggtgtggcac ctgtacgtga tccgctgcgc ggagcgcgac gagctgcgcc gccggctgga 33 0 0 
acgagccggg gtccagaccc tgatccacta ccccgtgccc ccgcaccggt ccccggccta 33 60 
cgccgacgac ccggccggcg caccggcggg gacccacccg ctcagtgagc gcctggcggc 342 0 
gcagagcctc agccttcccc tgggaccgca cctcggggag gacgaggccc gcgccgtcgt 3480 
ggcggcggtc cgggcggcgt ccgcagggct ggcggcgtac ccgacgccgg acggccagcg 3540 
ttttcctcta gtgacggaga aacgatgacc gaggtcatgt cagggcgtcc cggaatgaaa 3 600 
gggatcatcc tcgcaggcgg cggagggacc cgcctacgcc ccttgaccgg cacgctgtcc 3660 
aagcaactgc tgcccgtcta cgacaagccg atgatctact acccgctgtc cgtcctgatg 3 72 0 
ctgggcggca tccgcgagat cctcgtcgtc tcctccaccc agcacatcga gctgttccag 3780 
cggctgctgg gcgacggctc ccgcctcggc ctcgacatca cctacgccga acaggccgag 3 84 0 
cccgagggca tagcgcaggc catcaccatc ggcaccgacc acatcggcga ctcaccggtc 3900 
gcgctcatcc tgggcgacaa catcttccac ggccccggct tctcggccgt gctccagggc 3960 
agcatccgcc acctcgacgg ctgtgtgctg ttcggctacc cggtcagcga cccgaagcgc 4020 
tacggcgtcg gcgagatcga cgaccagggc gtactgctgt ccctggagga gaaaccggcc 4080 
cggccccgct ccaacctcgc cgtcaccggc ctctacctct acgacaacga cgtggtcgac 4140 
atcgccaaga acatccggcc ctcggcgcgc ggcgaactcg agatcacgga cgtcaacagg 42 00 
acctacctgg agcagaaacg cgcccggctc atcgaactgg gccacggctt cgcctggctc 42 6 0 
gacatgggca cccacgactc cctcctccag ggcggccagt acgtccagct catcgagcag 4320 
cgccagggag tgcggatcgc ctgcatcgag gagatcgccc tgcgcatggg cttcatcgac 43 80 
gccgacaccc tccaccggct cggccgcgaa ctgggcacct ccggatacgg cgcgtacctg 444 0 
atggaggtgg ccacccgtgc aggcaccgaa tgagacgccg cgccggcccg cccgctccgc 4500 
cggccgacgg ccgccggccc ggatcctcgt caccgggggc gccggcttca tcggctcgcg 4560 
cttcgtgaac gcgctgctgg acggctccct gccggagttc ggcaaacccg aggtgagggt 462 0 
gctcgacgcg ctcacctacg cgggcaacct ggccaatctg gccccggtgg gcgactgtcc 4680 
ccggctgcgg atcttcccgg gggacatccg cgaccgcggc gcggtcaccc aggcgatggc 47 4 0 
gggggtcgac ctggtggtgc acttcgcggc cgagtcgcac gtggaccgct cgatcgacga 4800 
cgccgacgcc ttcgtgcgca ccaacgtgct gggcacccag gtcctcctcc aggaggcact 4860 
ggccgtacgc cccgggctgt tcgtgcacgt ctcgacggac gaggtgtacg gctccatcga 492 0 
ggaggggtcc tggcccgagg agcacccgct gaaccccaac tcgccctacg ccgcctcgaa 4980 
ggcgtcctcc gacctgctgg cgctggccca ccaccgcacg cacggactgc cggtgtgcgt 5040 
cacccgctgc tccaacaact acgggcccta ccagtacccg gagaagatca tcccgctgtt 5100 
caccagcagc ctcctcgacg gcgggaccgt cccgctctac ggggacggcg gcaaccggcg 5160 
cgactggctg cacgtggacg accactgccg gggcatcgcc ctggtggccc ggggcggccg 522 0 
gcccggcgag gtctacaaca tcggcggcgg caccgagctg agcaacgtcg agctcacgga 52 80 
gcgtctgctg aaactgtgcg gagccgactg gtcggcggtg cggcgggtgc ccgaccgcaa 53 40 
gggccacgac cggcgctact ccgtcgacta caccaagatc gcggacgagc tgggttacgc 5400 
gccgcggatc accatcgacg aagggctgga gcggaccgtg cactggtacc gggagaaccg 5460 
cgcgtggtgg gcgcccgcga agagggggcg atgacggtga cgaccgcatc cgtggacccg 552 0 
ctcgacctgt ggctccgccg gtaccagccg tccgcgtcac ccgccgtccg gctggtgtgc 5580 
ttcccgcacg cgggcggctc ggcgagttcg ttcctgccgt tcacccggca gctgccggac 5640 
cggatcgagg tcgtggccgt ccagtacccc gggcgccagg accgcaggag cgaaccgctg 57 00 
gtcgacacca tcgagggact ggccgagccc ctggccggcc tgctggaggc gcaggccggc 5760 
cccccggtgg tgctgttcgg gcacagcatg ggcgcgctgg tggcctacga ggtcgcccgc 5820 
gcgctccagc ggcggggagc ggctccggtg cgcctggtgg tctccgggcg ccgggccccc 5880 
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ScSSc^ a™ c g S " cgacgacg accggctggt cgaggaactc 5940 

ctgcccgtga tccgcaacga ctaccgl^c ? CggagCtgct ^cggctggtg 6000 

ccgctggact gccccctcac cgtgttScc SS™ acgcccacc S cccg ggggcg 6060 
gaggcggcgg cctggcacga agcgacaaca SS-^^ aCCCCaccgt Saccgcggcc 612 0 
ggccacttct tcccgtacca gjggaccgc? aaSta^^ ag3CgCgcac ^tccccggt 6180 
gagccgctgc tgtcggccag gacacacaaf g&ggtgcgcg ^ccctggt cgacacgctc 624 0 
cacggtcgag tacgccgtS? SggcgSc Zr^" tCCgCccggg fftgacgtggg 6300 
cctggacagc ccggtcaccg "SSL cg ^a<=gg gtgagggtct ccgccgacac 6360 
ggcgcaccgc- CtSacgtcg aaccga'ccc ff SaT^ tggCtggagg aar.accaccg 6420 
gccgggcacc ggcgacctgc ggcacgaaac gggcSctS S^T^ ggtcctt ^ a 6480 
caccagctcg gacgccgatc cag^cacc-a -tctccgtgg aggggctgcg 6540 

ggggctgctc ggcatcctag cccgaSaa^ 9 ^ atCatc ^gc agcccgaggt 6600 

caaacccgag cccggcaacj tScggg^t JcaS ? Ctgcactt ^ ^gatgcaggc 6660 
cagcaacttc gacgaggtgc accacgS JtScccca ^t"^ aggCCacgc S 6720 
ccgccccggc cgccgggtcc tgatcgacaa oltrnt^ 9 ttcctc ^ acc acttcatcca 67 80 
gcacaagcgc aaccgcaaca tggtcatcaa ^ Cca ^c g^acagggcg actggttcct 6840 
gttccgctgg ctgaccctcg gglagatccg g3CatCgagg ^acgccgc 6900 

catggacacc cgcagtgtgc tggcctotct acac-T^ Ctcca ^gacg acctcgtcaa 6960 
tgacgactcc ttcccggcgg cgctgcgccg c c c S CaCggCa ° gC <=cgacgacgg 7020 
cgatctgcac gccatcacca gctgccS C L C 1? C gggga 9 a ^g cgccgttgca 7080 
gcagagcgtg ccgctcgacg acgcccaa™ anTr- gcgctgc ^3 tgctgcgcca 7140 
ccggcatcgc agcggcaag? Steals? g f aCggCtgg ^^ggaccg ggagcgcgat 7200 
tgaagtggcc toggle agccgJSct g^SSe J 1 ^^ cggagcgccg 7260 
gatcacccgg cggatcaacg gagtgc^gca S ! 5 tCgCagggac tggcggccct 7320 
cacgctcaac gtcgccgag? £££c£c cgtccaaSc ^ ggCgCggt cgga ^tcgg 7380 
ccagtcgccc ccgtacctgo accgggtSct aS^f Cggcccgacg ^ggcggacgg 7440 
cgtggtgcag tcggagga^g gcgSctt ga ? ggCCgga ^cgaccgcgr tccgctacga 7500 
cgaggcgggg ccggagct^ acacgSctg '7^ , Cgcaacc ^t atctggtggt 7560 

ccagctcacc gaactgctcg cgcacaSca! ctatr^ \ tctgct ™ ctaccttcgg 7620 
ggcgtgcgca cacgcctcct a?tgaa?ogt 21 ^ gtc 9aactcc gcaccctcat 7680 
cagcgcgcca ccggccggcc ggcfcccS aJa^ gCaCCgcgcg ^agaatcgg 7740 
cctgcgggaa acggcggaac ^ccggcS aaSS^ 9 CCgttctccc gcatcggcgc 7800 
gggagcccgc acgaggaacc SttSccJ «ttcS?f aattcc <W gggacacggt 7860 
ccgcctcccg gccgggccgc ggaatacaar ™~ ^ 9 gccc ^ccgc gggaccaccc 7920 
tccggaaaag cgcgSccga JSccccfga a^ 9 ^" gaggacattc ctttcccgcc 7980 
cggacggcgg cccggcgtcg ScgcaSg cccgaSS g f CggaCgg cgactgcgcg 8040 
gaggcgaaaa tgatcaatct cttccagcc? caaa^™ & gaCgagaca S cgcgacgcga 8100 
tccgaggtct tcgacgacca atggctcgat caSSSoo CCgaggaact ^ggcggtg 8160 
gcgttcgccg agcacctcgg gg^agcccc IZf Waeegcggc gttcgagtcc 8220 
gccggcctct tcctggccc? SagSgStc SS^ C9 tcttcc ^aa ctcgggcacc 8280 
ccotcgccca gcttcctcgc cgcaacgaac acoS^ 0 CCggcgacga ggtcgtgctc 8340 
ttctgcgaca ccgacccg^g gacgcSac c ' 3 ? C tCtc ^gagc gcgcceggtg 8400 
accccgcgca ccagggccgt JatcgcgcJc 2o 3gCaCatCga Sgcggccgtc 8460 

cgcatcgccg agcgctgccg ggagcgjggc aSccS? gCCaCCCCgg egacatcgtg 8520 
gtggcctccc gcgtcgacgg c^gacSSc aL a ^ tcgaggacgc cgcgtgctcc 8580 
ttcgacgcca tgaaggtcS ggEcJgc S™£ 9 gCgacctc ^ catgtggagc 8640 
ggggcggccg cccggatccg gcgccScc ^f 02 ^ tgatctacgt caaggacccc 8700 
ggatacgcca gggtctcgac JcgctggJaa aa^f^ 00 tCacgcggtc cagcggcctg 8760 
gtcatcggga acgacctcac S^ggSfc ™™ tCCCCgaacc ffggccgccgc 8820 

ttcgtggccc gccgcaggga gJtStcgcc agttgCgCCg ^"cccbbc 8880 

ggcgtgctga caccgcccgc gccaScaca t™l 9 t gcgaactga ^ ctcgctggag 8940 
atccagctgg cccccggc^t JcgaSaccag CC \ CgCaCta ^tctactgg 9000 

tacaccacct tccgctacgc acctetgS? 3 acct 9 c tcac cgacggcatc 9060 

gaactgcccg gcgtggagcg ggcgtccgaa caaaof CCtaCggcca ^accggaggc 9120 
ctgtcggacg ccgacgtccg caStcata S? f ^ gcct ^ cccc t gcaccccggc 9180 
gatccggccc ccgcctgacg g S £ tcc.ccctgc gcagagccct gagcgccgcg 9240 
ggacaggggc cgtggcjca? cctacogfc? ^ CggCCCC tgtccc ^ c 3 gtgaccgccg 93 00 
gtcagcgacg cgtgccga^o SgaaSca Sl^f ccccgc ^tc ccgtcggtgc 9360 
cgtccaggcc ggccttjcgg taScgacc? ° 9CCCgtCaCg a -gtactcga 9420 

agtccacce g Ctgcggtgc cgg :^ --ccgc acgcgagaac agcggag 9430 
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ccatccgggt ccgcccgccc tcccgggtcg agtgggagac acgggcgacg ccctggtcgc 96 00 
ccggtgccgt ccgcagggcg tgggtggaga cgtggccgtc caggaaggtg tcggggaagt 96 60 
accacggttc gacggccagg acaccgtccg cggtcaggtg ccgcgccatg gcggcgacgg 972 0 
cgtcctccag gtcggccgtg gtctccaggt acccgatcga gctgaacatg cagaccacgg 97 80 
cgtcgaacgt ctcgccgagg tcgaacgccc gcatgtcacc gcggtggagg gtgacgccgg 9840 
ggagccgctc ctcggcgcgg gccgccatcc actcggacag ctccaggccg ctcacgcggt 9900 
cgtagagctt ggcgaaggcc tccaggtggg taccggtgcc gcacgcgatg tcgagcaggc 99 6 0 
tggccgcgtc cggcgtacgt tcccggatca ggtcggtgac ccgggcggcc tcacccgcgt 10020 
agtccttgcg gtcctggtag agcaggtcgt agacctcggc ggcactgtcg ttctcgtaca 10080 
tgggaatcct ccgggccgtg aagggggaac cgtgggtctg tcgaagagga gtgcgccgtg 10140 
cgctcggggc gggggcggcc tgccgccggc ccctcgcgat gatctccgta cggacaccca 102 00 
acagttcacg ccgagccggg gtcaaggaac gacggggtgg tcagtcaagt cgggcgctcc 10260 
gcccccgggg cggggcgcgc cggcgacgcg cacggattcg gccaaccggt tgctcgttcc 10320 
gccggaaatc acggtgtggc ccccgggcca ccgggtagct tatgcctcgt tcaccgcagc 10380 
ggttgaagag gcagccttca accccggccc ggcctttatg gaattcattt ccaccgtgcc 10440 
gcaacaccca ctgaaggacg gccggatatc ggccatgaag ccccggcctt tcagccaggc 10500 
accctctctt gtcgaataga gtatgtcctc cgctgaagcc gccgaagacg gacgaagggg 10560 
acgaacggtc acctcggtcg atctagacgg aatccttgaa agcgtaatag cctgtcaatg 10620 
ctttggtaaa gcacagggat gggggtgcct gcgggatgag tgacctgggt tctggtgaag 10680 
aagggtccga agaagacgag tcggacgacg cactcgcctt cctcgagttc atcgcccggt 10740 
cggcaccacg gagcgaatac gaccggctca tggcccgcgc cgaacgctcg ggcgccgacg 10800 
aggaccggat gcgccgactg gagcgcttca accggctcgc cctcaccgcg cagtcgatga 10860 
tcgagtaccg ccgcgaccgg gaggcggagc tcgcggccct ggtcgacgcc gcgcacgagt 1092 0 
tcgtcgccgc ccggcggggc aaggacctgc tggagtccat cgcccgcaga gcacggctgc 10980 
tgctgaagct ggacgtctcc tacgtcggcc tgcacgagga ggaccggccc ggcacggtgg 11040 
tgctgagcgc cgacggcaac gcggtcaagg tcgccgagag ctaccggctg ccggccgacg 11100 
gcggactggg cgccatggtg cgcacctgcc gcgctccctt ctggaccccg gactacctcg 11160 
gggacaacag cttcacgcac gtcgaggccg tcgacgacat cgtccgcgcc gaaggcctgc 1122 0 
gcgcggtcct ggccgtcccg ctgtgcgccg ggggcgaacc gatgggggtc ctctacgtcg 11280 
ccgaccgtca ggtgcggcat ctgaccccca acgaggtcac cctgctgtgc tcgctcgccg 1134 0 
atctggccgc ggtggcgatc gagcgcaacc ggctggtcga ggagctccac gacaccatcg 11400 
ggcaactgcg ccaggacatc ggcgaggccc gcaccgccct cgcgcgcacc cgcaggtccg 11460 
ccgacctcca gtcgcacctg gtcacgeagg tgatggacag gcgcggcgcc gactcgttac 11520 
tcgcgacggc cgccgaggcg ctcggcggcg gagccggcct gtgcagcccg ctcgggcgcc 11580 
cgctcgccga gtacgggacc ctgcgccccg tcgcccccac ggaactgcgc gcggcgtgcc 11640 
gccgggccgc cgagaccggc cggcccacct ccgtggcccc gggggtctgg acggtgcccc 11700 , 
tgcttcccgg gggcaacgcc ggcttcctgc tgaccgacct cggtccggac gcggaccaca 11760 
ccgccgtccc cctgctcccg atggtcgccc gcaccctcgc gctgcacctg cgcgtccagc 11820 
acgacgactc ccccaaggcg cagagccacc aggagttctt cgacgacctg atcggggcgc 11880 
cccgctcacc cacgctcctc agggaacgcg ccctgatgtt ctccctcagc ttccgccgcc 11940 
cgcacgtggt gctggtggcg gacggacccc gcgggacctc gccgcggctg gaggcctccg 12 000 
gcgccgacta cgcgaaggag ctcggcgggc tgtgcagcgt gcgggacggc gccgtcgtcc 12 06 0 
tgctgctgcc cggcgacgac cccgtcgccg tggcgcagac cgccgccccg gagctgaccg 1212 0 
accgcgccgg gcaccccgtc accgtggggg tcgcgggccc cgcctcgacc gtcgacggca 12180 
tcgccgacgc gcaccgtgag gccgcgaagt gtctggagac cctccgcgcg ctcggcggcg 12240 
acggcggcac cgcgtgcgcc tccgacctgg gtttcctcgg catgctcctc gccgaggaga 12300 
acgacgtccc cggttacatc aggacgacga tcggccccgt ggtcgactac gacacccacc 123 6 0 
gcttcacgga tctggttccc actctgaggg tgtacctgga gtcgggcagg agccccacgc 1242 0 
gtgccgcaga gacactgcgc gtgcacccga acaccgtctc acggcggctg gagcgcatcg 12480 
gcgtactgct gggagaggac tggcagtcac cggagcgggt gct-ggacata caactggccc 12540 
tgcggctcta tcaggtgcgc tcggcgctct cctcgcaacc ggcgtccgag acccgggccg 12 600 
tgctcggatc gctgcgcgag tgacctctcc ggcacgggcg gcgccccgcc cgtcggcgcg 12660 
gatcgcgccg acaggcgggc gttgaccacc ggccaccggt cccccgtacg acgaggtccc 12720 
gggcccgcgt ggttcagccg gcgctgaact cggcgatgcg cccgtctccc atggtcagcc 12780 
gggcgccggt gaaccgggac cgcatccgac ggtcgtgggt gacgaccacg acggcgccgc 1284 0 
ggtagtccgc gagtgcctgc tccaactcct ccaccagcac cggggtgagg tggttggtgg 129 00 
gctcgtccag cagcagcagg tccatcgggt cgctcaccag ccgggcgatc tcgatccggc 12960 
ggcgctgccc gtaggacaga tccttcacgc gtcgccgcag gtcggacggg ctgaacaggc 13020 
cgagcgacag cagt'ttctcc gcgtggtcct ccaggtagcc ctcccggccc tgggcgaagg 13080 
cccgcagcac ggtcagtccg ggcgcccagg gcgtctcgtc ctgccgcaga tgaccgaccc 1314 0 
ggcagccgac gcgcaccgag ccgccgtccg gctccagttc cccggacagc acccgcaaca 13200 
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tcagggagtc cacggcgagc cgfcccgcgf cScaScaS CCgttCgCCg ^ccggatcg 13260 
cctccgcctc cgggcccgcg gtgtcqftgc Sgtgagttcg gccaccgcct 13320 

cgtggaccgg gttctcggtc ag^tacgcca 9g3CaaCggg ^cggcgggag 13380 

tcgcgccgtg gtcgcgccct cgcctacaat till 9 5* Cgc ^ c ^ atccgcacca 13 4*0 
tcttgcgcgg gatgccgtcc atccgeacL cStaa^ ? gCCgaacac 9 ^gagggaca 13500 
cgagttcggc acgccactcc tcgta^ccc aca^™" gatcagccc 9 cggttgcggt 13560 
ccgtcaggta gccctcgtag ccjttgccgt SS^ ^tcgcgttcc acggccttgg 13620 
ggatcgtggt ggtgagccgg tcgagSaX Si ^^gag tcgacctcca 13680 
-cgcggtggcc ggccaggtgg tccf.ccaoS StS?™* Sfftgaccgcg atcaccgtgc 13740 
tcggttcgtc caggagcagc agctccggcg SaScaao CCggtCgtcg aggtcgttgg 13800 
gggagcgttc gccaccggag agggtt^g! acltalaltl ggtCgCggCg agcgcgaggc 13860 
cgaggccgtg cagcgcgacc tccacgcgS ScJaSS gc ^tccagg ctcggcagtc . 13920 
actgctcgac cagagcggcg tagcgStJgl ScScaS gtag f CgCCa ^cgcctggt 13980 
tctcgtegct ctcgcccagc tccocctcag cctcacaS? CagctCgc ^ tcggagccgt 14040 
ggtcggacag ggccaggtcg acggcatccj ScaS^ CgCCgCttc ^ ^gctcgcgca 14100 
tctgcgccag gtagccgacg ccqL^« SSacggtggc gtcgaggg gc agttccagtg 14160 
ccacgcggcc ggcgaggat? ttSgSgS ^^cgccg ttgtcgggct? 142 20 

cgccgacctt ctcgcccgac ttaat ac*£f ^ ggactt 9 cc ggaaccgttg tcgccgatca 142 80 
ggtagcgctt cgtgatgSg t££££ f Cgagcacg — agtcgt J"fS 

tttccacgat gaggatgagt ggatglgtja Cgacac £Tcgt aagtctcctg 14400 

gggacgccac cactgcggac atggccjg^ laaaaala^ agaaagaacg ^aagcagaa 14460 
ggcaggcgga gtcagctcaa cg?cggS£t cfSfSS aCgagcac ^ c tgctggatgc 14520 
aactatagcc gtgctacccg gtgccgSca aca^f ^acagagatc ccatgcgaag 14580 
tgcagtcgga ccgggatga? JgcttScJ gcScSa^ tg \ Cgcacc S ^ccgacgtga 14640 
acagcggtct ttcacgagag gggtcgaccf ^ctagcctc gggagcaacc 14700 

tggtccgcgc gtaccaccgg gaacaScS ^ gggCgatct ^aggaaccgc atcaccgagc 1*760 
taccggtctc cggcgcgg?g ctgagSaJg S^'f Cgttccc ^ acgacgcacg 14820 
tggagatgcg gatcgcggcc gg^S?? cSSSSSX ggCgCtggtg gagacggcgc 14880 
acctcgggct ccggaaggcg cacctgaS actccSttc ^ agCggCag ttc 9 ccc ^t 14940 
tcggcgcgct cacctcgccg cagctggaag aaaaacfa^ CtC ^ gcCaac ctcctcgccc 15000 
tcacggtcgc cgccgggttc ccLcgaS tcaacceS ^ gtCCgggg ^acgaggtcg 15060 
ccgtcttcgt ggacgtcgag ctcggcacS acaacaca^ Cttccac ^= gggctggtgc 15120 
ccatcggccc ccggaccagg gcgatcatga tcacaS* gccc 9agcgc atcgagcggg 15180 
ccgaagaggt ggcccgcctc gcggacgagc SScto^ CC " gggCaac cccttcgagg 15240 
acgcggtggg gtcccgctac caaaacaalr f ggagCtgtt cctcatcgag gacaactacg 15300 
tcagcttcta tcccgcgcac cfcScgS taaSf ^ ° ttCggCgac ctgtcga^cg 15360 
acctggccct ggcgcggatc ataaaat™, tZ^ZZ™ ^gctgcgtg ctcac cgaca 15420 
agccgggtga ggacaaccgc tgcJtcaag'c lattlalrrl ggggcgcgac tgctggtgcg 15480 
ccgggtacga ccacaagtac atcttctcac SS^f* ^ ST^atgggt gacctaccgc 155*0 
tgcaggcggc cctcgggctg tcccagctja ccSSS™ CaaCCtgaag tcgaccgaSc 15600 
gcgccaactg gcggcatcta cacgccacat tSS? 9 ggagttcacc gaggccaggc 15660 
atgccacacc gggcagcga^ c^JSgg ttgScct g ° CCggtCtg -tgctgcctc 15720 
ccgcgtacag cagggcggcc ctgg?c ga ?c aSSaaS CaCCaccgt 9 gacccggacg 15780 
gcctgttcgg gggcaacctc gtgcggLcc ccoS! 9^cggatc agcacccgcc 15840 
ccggctccct ggagaacagc gacctaatra ^ cgaccgtcgg taccgggtgt 15900 

ccggcatcac cccggaga^g KcgcScg Zl? C gttct ^tc ggggtc^tcc 15960 
agcactcctg aggg gcggcg gta 9 ^ g J^f^ gatccgggag tgcgtgctca 16020 
ccuccggggc gtcacggccg cggaag^gtc JafaS^ 9 gggaggacc 9 gggcggtcct 16080 
cgcgcggtga gcagggtgcc ct egg g tgcSata^ aggCgaggtc ^tggacc 16140 
tgcacccgcg ccaccaggct ccccSa?^ tfS2?» ^gagcacctc gccctcgtcg 16200 
gggtgcggca gca gg cgg tc gatcagttcc c ^^tccac ctccacctcg 16260 

geggacaega cgatcgcgtc cggctSctgc tccaSc^f Cgat ^ cc ^ acccgaacgg 16320 
gegacategg ccttgttgac gaccacgacc gggegaggae gtccgggtcc 16380 

agcacctcgc gcaccgaggc cagctafocg ccaSaJ^ Cg = Cggcgcc cacgtcccgc 16440 
tgcagcacca gatgegegtc cgjga^c^c? ggtgc ^ aacc gtcgaccacg 16500 

tggtgcggga ggtggcgtac gaaacccaca ata^f " aacggaac ^ c ctccaccagg 16560 
ggegtegteg cccgccgcac ggt^tgtc? S S a tggtgtaggg Bcgcccactc 16620 
acgccggctc cggtgaggcg attgagcaac alflllf^ acagggegtt ctccaccagc 16680 
agggegaccg acagcacctt gttScocc? S£? " 5C Cggc ^ tt ^ t gtagccggcg 16740 
ttcagctget ccagctcccg S j g^'ctta' ggt . tCacgtc -ggccggt? 16800 

gg _cc.g g.ca,cu,g L cgttgatccg ccgccggtcc 16860 
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gtctcgatct tcgtctcacc gggaccgcgc gtggccatgc caccgccgcc accgccgccc 16920 
atctgccggg acagcgactg gccccagccg cgcagccgcg gcagcatgta ctgcatctgc 169 80 
gccagcgcca cctgcgcctt gccctcccgg gactgggcgt gctgcgcgaa gatgtccagg 17040 
atcagggccg tgcggtccac gaccttgacc ccgacgacct cctccaggtg catcagctga 17100 
ctggggctca gttccccgtc gcacaccacg gtgtcggcgc cggtctcctc gacgatgtcg 17160 
cgcagctgcg acgccttgcc cgagccgatg tacgtcgccg ggtccggctt ctgccggcgc 17220 
tgcacgacgc cgtccagcac gagggcgccc gcggtctcgg cgagcgccgc cagctcggcg 172 80 
agcgaactgt cggcctccgc ggccgttccc gaggtccaga tgccgacgag caccacccgc 173 40 
tcgagtcgca gctggcggta ctcgacctcg gagacgtcgg tcagttcggt ggagagcccc 17400 
gcgacgcggc ggagggaggc ccggtcctcg cggtctaact gatcgccgtc ccattcctcg 17460 
gcgtcggcgc cggccatcgt gtcgtccatc agtgcgtcgg ctcgctgcgt gccggcgaag 1752 0 
tcctcgggat gcgtcaaagt acttccaatc tggggggttc gagagcgttc cggggcgggg 17580 
cgcgtccggc ctgcggggcc gggcgcgggg ccggggggtc ggggccgacg tgtccgcacc 17 640 
tcgccgtcgg gggccggtgc cgtggaggtc gctgccggaa ctcacatgcc gtccacccta 17700 
gccatgtcgc cggggtgtgc aaggacgtat cggcgatcac ctccccagct gacagagtgt 17760 
gcaccgggta ctgcgcccgc gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc 17 82 0 
attatcgggg gttcacagtt cgtgggccgg gccttcgccg ccgaggcact ggccgcgggg 17880 
caccgggtca ccacgttcaa ccggggtgtc agcggcaccg acctgcccgg cgtcgaggcg 17940 
gtcaggggcg accgcgaggt ggccggcgac ctggagcggc tggtgtccgg aaggcactgg 18000 
gacgcggtcg tggacacctg cggttacgtg ccccgcacgg tgggggcctc ggccgcggcg 18060 
ctgtccgggc acgcggacac ctacctctac gtctccagca tcgcctgcct gcccgactgg 1812 0 
gcgcaggcgg tccgtccggt ggacgacgac tcacctgccc acgactgccc gccggacgcc 18180 
ggaccggacc acgccgacgg tgactacggc gtcctgaagg ccggctgcga gcgcgccgtg 18240 
gaccggcact tcgcgggccg gaccctgcac ctgcgggccg gtgtcatcct cgggccgcac 18300 
gacaccatgc gcatgctcga cgcctggctg tggcgcatgc gcgtcgccga gggggagcac 18360 
cgccgggtgc tcgccccggg caaccccgag gtgggcatgc gcctgatcga cgtacgcgat 1842 0 
gtcgccgtct tcggcctcga ctgcctcgcg gacggccgta ccggcgcctt catcgtcaac 18480 
ccgccggaga agaacaccac cttcggggag ttgctcacgg agtgcgtcaa ggccaccggt 1854 0 
tcggccgcgg agccggtgtg ggtcgacgag gggttcctcg ccgagcacgg cgtgagtccg 18600 
tggacggacc tgccgatgtg ggtgcccgac accgcgcggg acaccctcgt gtgggcggcc 18660 
ggagcaccgc gcgcccgggc cgcgggtctg gcctgccggc ccttctccga caccgtgcgg 1872 0 
gacgcctggg aggtcgtccg ggaccggccc gtcccggaac tgccgctcgc ggccggctgc 18780 
ggcctgtccc tgagccggga gaaggagctg ctcgccgcct gggacgctcg cggcggtgcg 18840 
gcggcgggct gacgcggccc ccgaggagtg cgacgccgtt tcccgctcgc ggggagcggc 18900 
gctcgcgtgt ccgccccgcg gcccggcggc gcgtcctgtg tcccggcgcc cggggcgcgg 18960 
ctacacggtg aaggtctcgg cgcgggccac gatctcgtcg accagccccg cctggcgcag 19 020 
cgcggcgtac gactcggcgg agacgtcctc ggcccggatc accgcacggc ggaagaccga 19080 
caggatgttc acgaagtgcc ggtccacggg caggacgcgc tcctcccggt ggtcctggcg 1914 0 
ggacagccgc agtacggggt ggtggctgtc cggggtcgtg aagacgtggc tcagggcgag 19 2 00 
cgagccggtg ctgccgtgca gctcgtacgc cgagcggtag ccgtgttcca tgccgaaggc 19260 
gaggtgggcg gccacgccct ggggggcggc gagcaggacg ctgccggaga ccacgacgcc 193 2 0 
ccggcggcgg tcacggcgca gcacggcgcc ggtcaggcgc agttcgggtc cgaggaagtg 193 80 
cagcgcggcc cgcagcgggt agacgccgtt gtcgagcagt gcgccgccgc cgatgtcggg 19440 
tcggtagcgc atgtcgtcgt cggcgcgcgg cgggatggtg aaggcggcgg agaaggtgcg 19 500 
cagctctccg atggcaccgg cctccaacag ggctttgacg gtggcgtgtt gagagtggtg 19560 
gaggaacatg aagttctcca tcagtaccag tccgcgctcc cgggccatgg cgaacaggcg 19620 
ggccgcgtcg gcgtggttgg cggcggcggg cttctccacg aggacgtgtt tgcccgcccg 19680 
cagcgccgcc gcggcccatt cggcgtgcag catgctgggc accgcgatgt agacggcgtc 19740 
cacgtcgggg cgttccagca gggcctcgta gggcgcgacc gcctcgcagt cgaagtgcct 19 800 
gcccagggcc ttggcccggt ccgcgtcgcg gctgccgacg caggtcagca cggtgccggg 19860 
ggtggagagc agggcgggca gggtgcgacg gcccgcgatg tcgccgcagc cgatcgctcc 19920 
gaagcgcagc accggggacg cttccggccg cggcgggccg ggtgcggcga acggttcagc 19980 
agaagtaccc agggcggtca tggatggttc cgtcaatcgg tccggatggt cacggcacag 20040 
cgtggtgaac ggccggcgca cacccacgag tcgcttccgg caatgggcgg ccctgaagct 20100 
acccggcggc ccgacgcgac ggcaaggccg atctgacaca gtgccgcgcc gagggaccgt 20160 
cggtgccccg cgtacccgct gacctgacac tacgccgacc aatctgtgga cggggcggtg 20220 
gccgcccggg ttaggtgagc gcggcgcccg cggtgaccgc gacgccggtc cgaagcggcc 2 02 80 
ctcggggcac gccgttggag agaggagacg cgggtgacgg acgcgatcac gaccgagctg 20340 
gccgaccgcg aactggggcg cagactgcac cggatacgcg gcgtccactg gtatttcggc 204 00 
aaccacggtg acccgtacgc cctcatcctg cgcggtcaga ccgacgaccc gtcggtgtac 20460 
gaggagcggg tccgcgaggg cgggccgctg ttccgcagcc gtaccgggac ctgggtgacc 20520 
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Sggaeg g ? SZ ^ CgaCtCgC ^ttcggtgc gctggaccgc 20580 

cgcgccgcot ScgcgSt Scaaca^ CCgtCgCCCg ccacgtacct ggggctggac 20640 
gccgcgtggc gccggSgg JSSc ^ CgagCCCg tgctflggcgc ggacgccgcc 20700 
ggcctcgacc ? g aS g cgga cttcac^ac g f CgCCggC ^tcarcegg ccgcggttcc 20760 
ctcggggtgc cgggSaSg Ita^Tcala SS^**? CattggtCCt ^ccgcgtgg 20820 
ctgctggacg gtctactatS f LI? 9 t^aggagt cgctgcgggc ggcggggccg 20880 
gccgajggg? Scgcgcgcf ! 2 ^cggeca cccgtgcggc ggactcggcc 20940 

gagggtgcag tqgccSt L'!l 9 9 ^ggtcgccg ogcgtcccgg cgggtccggc 21000 

google S^SSff-SS?^ SSF^" -gacgacgc ggtggccgcc 2-106-0- 

cggctgctgc tcgaicgacc SaaKaS ^ CgaCga ^ ga c ^tggtgtg cgaagcggtc 21120 
ccggccgcgg tccggcacac ccScScI? ^ gCggttgt '^gactcccc cgctctggcg 21180 
gcccacgagg acggacggt ggcggaSt ara^" tgCggCtg ^ gagccgggtg 21240 
ctcgtgggcg cggcacgjcg ScJScocc r^T^ CCgggagcca ^gtggtggtg 21300 
gcaccggcgg cggagcgcS gaacafcS C ^ CgCgg a ^cg g c g ga cctggcgggc 21360 
cgtgccgccg agacSgc?ct La a 9 ^ttcgcgc tgtccgggga gttcgtcggc 21420 
ggcgacatcg tSgacgJcg ccKKcca CCCC Sggact gcggcgggac 21480 

gcgtactcct gacg^ccg aaaccaaaaf ,nn t T* 9gtaC ^ c ^ gttccccgtc 21540 
ggagtgccgt Scgcg^cctg agaccSa tc^^ CCCCacgac S "tcatgaaa 21600 
taccgctgat ctgggctcta iSnnnl tccc Scacca cacgcactac taccacctgg 21660 

cgctggtJga c S gccagcggS ES ^ ggCCagc <^ 2 ™ 
cgctagcgca gatcttcaaa Lr^™ tcccggcgtt cgccctggcc gaggaggagt 21780 
acgagftcga ct^cttcSK " ^atctcca gccgtatcag cacggcatcg 21840 
agcaggtgat cctgtccjgc ctaScS 3CgagC . tgga ^gggagaag ctgctcgccc 21900. 
gcatcgtcaa cttSacccaa acX™f ^ aacc 5 ct ^aa cggcgccacg accctcgaca 21960 
atgcggggcc gg^ggcgacc caallatT cc ** cc *** gctgtgggag ccgttcacct 22020 
cggacacgat cgggltg^tg £2225 gggC f 9CgCa ^cccgcgtc ctgt 2208Q 
agcaccggga cgaTccfgt! aSaStS ^ ctt fW ^aggcgcgt cagcccgagg 22140 
acttccg^ga gSggacatt ctcaatr^ tgaCCtgggc cctggcgcgc tacgggtgcg 22200 
gtctggScct Sacc^gcS accatcccaa F^f^ «cg«tOBOff gagggcgtca 22260 
tgatccccga c^ggctgacc JSXacS LgCgCta f ac ^cgtacaac gggtcggcgg 22320 
tgtcctcgcg ggagcacagt alaalaat™ f aCggC f tcg srgtctgcctg accctggggg 223 80 
ccgatctcga caSaaSa Itn^n " 9 ^ CCCggt9ca gaggtttatc gaggcgctgg 22440 
ggatcccgga caa^S? ^tcgt^ct SS^S ~agcgggac ctgctgccga 22500 
gctcggcgat catcaa^cac tnZnrZ? - c gtsrcccat ggacgcgttg ctgccgacgt 22560 
tgccgca^at catcScggc aTcTactaa 9CaCgtgCaa caecgccgcg ctgcacgggg 22620 
agaactccgc cgccctcJcc ^cgccgccgt acggcagcac atgttcgcgc 22680 
cgctggtgca cctgctcqaa a " ^ agg3ggtgac cssrcgcgtcg ctgaggagcg 22740 
ggatg?gagc catJcccS SaccaaL ! CCgCgaCgg ^cgcggcgg ctgaaggagc 22800 
agcaccgScg ggcgtgttS co 1 tc Stgcc g ac cctggagcgc ctcacggccc 22860 
gactctcgcg gtg^cgat ITS g ^cccgtgc cggcggtgac cgcccgaccc 22920 
cgacactggf o?gctga?gc Z t cagccgtg g a ccggttcgcc tgtccgcgcc 22980 
tccgctagtc, ^cfatcacat aaat^ c *^c g c g cc g ctcgcgg gccacctgct 23 040 
ccgggaggac ttcJtgSa S 1^ ^ c ^ccggc cacgaggtac tggtggcgac 23100 
gcccgcfgcg gacctJgSg Sc^e™ gtCggggCtg ^gtccgcct cgtgcgggcc 23160 
ggcggaggc? ^ggg^Jtcc talaaalaao c tcgcgcggc cccgcggagc 23220 
gggggtgcgg cS g cg gcgg acg^Sgcg £££££ ^tc^c^ 39 gC3gtCtggC 23280 
gttcgccggg ccgctgatca coocaarr^ ^ccggauctg atcgtcagcg aacgggccga 23340 
ggtctcatcc ctLSr c gg<=ggccct cgg gg tccc g tgggtccgct accactgatc 23^00 
ScgctSSc ctSacS^ aCC ^ c ^cr c ggccgaggcc gagttcgcgc ccgagc^^gc 23^60 
JctgcgccS ccgScgSg J^^gtg ctcgatccgt ggccggtgL 23520 
cgcccccgtc ccSac?SS <=ggggtccgg cacgtaccgg cccacgggga 23 580 
cggcaccftg c^cccS? aScacS. CggtCgCggg "gcggatct gcgtgacgct 23 640 
ggcggagacc cgSgg^Jg "^Jcgaact oScaS" T" 0 ^ c ^gctgg t 23700 
gcggtggccg tcgctgScc? ccacX' ^cg.ggcg gtcgacgacg acgtcgtcgc 23760 
gctgcccgcg tacgacgcag tStSSf g ^ CgCCggC ^ctgccgc tggcggaggt 23820 
ggccgcggat ccgccgSaaa S'!! c &9 c gggcag ggcacgtccc tgaccgcgct 23880 
agcactgg,a !S 1 tcgtcatggc gcggctcgac gaccagttcg acaacgcaca 239*0 
^tggc?gc1 ggKcaS afa'ac^ 0 " CgtaCCgCcg tcccgggcca ctcccgcggS 24000 
gct^ccgag ga^tSca? gaacgccct 9 tatgccaagg cggcagccgg 24060 
cccgiaa^cc aag^Sca SccaraS gCCgtcggC9 ^ggtcggac tcctggaaca 24120 
c ggg.cgyaca tgccgcggag ttacccgaac gaggatgcgg tgtaacataa 2^80 
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atctggaagt actcaaccgt tcgaacgatc cgcgcgggcc ggtgatcacg gtggtcggcg 24240 
cgtccggctt catcgggtcc gccctggtcg ccgagctggc gcgcatgccg gt-gcggctgc 243 00 
gggcggtggc ccggcgcgag acccccgttc ccgcgggggc acgggccgcc gtrcgaggtcc 2 4360 
gccgggcgga cctcgcccgg ccggacgagg tcggggccgc cgtcgagggg gcggacgccg 2 4420 
tcgtgcacct cgccgcccac atcggcggcg cgcggtcgtg gcgcgcggcc gacgagcggt 24480 
cgctgcgggt gaacgtcggt ctgctgcgcg acgtggccga cgcgttccgg gaccgctcgg 24540 
ggcccgcccc ggccgtggtc ctggccagta ccctccaggc cggcgtcgag ctgtcccggc 24600 
agggcccgta cgcccggcag aagtcggcgg ccgaggaggt cctgctgcgg gccgcctccg 24660 
aggaggtggt cc'gcggcgtc gtgctgcggc tgccgaccgt ctacgggcgc agcccgctga 24720 
ccgggtggac gggccgcggg gtggtcgcgt cggtggcacg gcaggccgtc tcgggcgagc 24780 
cggtcacgat gtggcacgac ggcacggtcg ggcgcgatct gctccacgtg gaggacgcgg 2 4 840 
cccgcgcctt cgcggcggcg ctcggtcacg tggagcggct ggacggcggc acgtggtccg 24900 
tcggtacggg ccggctggag cccttgggag aggtgttctc ggccctcgcc gggctggtgg 2496 0 
ccgagcggac ggggaggccc cccgtaccgg tggtctccac ggagccgccc gaccatgccg 2 5 020 
aggcgggcga cttcgagagc gcggtctgtg acccctccgc gttccgcgcg gtgaccgggt 25080 
ggtctcccct cgttccgttg cgggcggggc tcggcgccgt ggtggagacg atggtggccg 2 5140 
acggagcgag gggtgggatc cgaacgtgag cacggaccgg gagcaggccg cgcacacgcg 2 5200 
gctcggtcgc agcgcgaccc tggtgagccg gctctggctg ggcaccgtga acttcagcgg 2 52 60 
ccgggtcgag gacggtgacg cgatgcagct gatggaggcg gcggtcgacc gcggcatcaa 2 5320 
ctgcatcgac accgcggaca tctacggctg gcggatccac aagggccaca ccgaggaact 25 3 80 
ggtgggccgg tggctggcca agagcgccgc gcggcgggag gacgtcctgc tggccaccaa 25440 
ggtcggcggg gacatgagcg aacggctcaa cgacggcggc ctgtcggcgc ggcacatcgt 25500 
cacggcctgc gagcagtcgc tgcggcgcct gggcgtggac cacatcgacc tgtaccagat 255 60 
gcaccgcgtc gaccacgccg cgccgtggga cgagatctgg caggcgatgg accgtctggt 2 5 620 
ggcgagcggc aaggtgacct acgtggggtc gtcgaacttc gccggctgga acgtcgccgc 25 6 80 
cgcgcaggac gcggcccggc ggcgccagtc cctcggtctg gtgtccgagc agtgcctgta 25740 
caacctggcg gtgcgccacg ccgagctgga actgctgccg gccgcccagg cgtacggact 25800 
gggcgtgttc gcctggtcgc cgctgcacgg cgggctgctc agcggggtgc tgcgcaagct 25860 
cgcggcgggc gtcgcggtga agtcggcaca ggggcgggcc cagctgctgc tgcccgagct 2 592 0 
gcgcgcgacg atcgaggcgt acgaggggtt ctgcggccgg atcggcgcgg atccggccga 2 59 80 
ggtcggtctg gcctgggtgc tgtcccggcc ggggatcagc ggcgcggtga tcggtccgcg 2 6040 
cacggtggac cagctggact cggcgctgcg gtccctggac ctggtcctcg gggaggccga 26100 
actggccgag ctggacgcca tcttcccgcc cctgggcaag ggcggccggg cgccggacgc 26160 
gtggatcagc tgaagggggt gcatcggccg acgtcacgcc ggccgatgcc gccggtcaca 2 6220 
cgacgtcgag cgcgggcagc gggaagacca gtcggccgcc gccgtcgagg aactcccgct 2 62 80 
cccgttcgac gaacccgtcc cggtagatcc agggcaggac cagcaactgg tccggcttct 2 6340 
gcgccttcgc gtcctcctcg gacacgatgg ggatgcccgt cccgggggtg aaacgccccg 2 6400 
ccttctcctc gctcacctcg ccgatgcacg gcaggtcccg ttcggtgatc ccgcagtact 26460 
ggaggatgac gttgcccttg gtggaggcgc cgtacccgag ggtcagcagg ccctcttggc 2 652 0 
gggagcggtc caggaagccg cgcagggcgt cccgctggtc ggcgacgcgg cgggcgaagg 2 65 80 
cctcgaacgg tgccatgccg tccagtcccg cggcggcctc ggcggcccgg atgcgggcca 2 6640 
ggcccgcctc gtccctcggg tgccgggaac cggtcctggc gagcgtgacg cacaggctgc 26700 
cgccgtacac ctcggtgagc tcggcccgga tgacggtgag gccgacgcgt tccgccatcc 26760 
actcgatctg gcgcagcgcg tagtactcca ggtgctcgtg gcagacgatg tcgtacgcgt 26820 
cggcttcgag catggcgggc aggtagctct gctccatcat ccagacgccg tcctcggcga 2 6880 
ggacgtcgcg gacgtcgctc atgaagcgca gcgggtccgg caggtcgtag aacatcgcga 26940 
tggaggtgac ggccttcgcc cgccgcgccc cgaagcggtt ctcgaaggtc gcgcgggtga 27000 
agtagtccac gaccaactcg gcgttcggcg ggtacaggtc gcggaacttg ccgccggtcg 27060 
ggtcgatgcc gaccagtcgc gggccgtcgg cggggtagcc cttgaggagc . gtggcgtcgt 27120 
tgctgccgat gtcgaggacc aggtcgtccg ggccgaggtc caccagccgg cggacggcgg 27180 
cgaccttgcc atgcaggtgg tcgaccatga agggccggat gcccgagcgg tagccgtagc 27240 
cctcgccgta catgaggtcc gggtcggggg tgtggcgcag ttgcacgagg ccgcatccgg 273 00 
ccggggaaca cgcgacgagt tccagcggga ccgacggcac gacctcgtcg cggtcggccg 273 60 
ggaacacccc ggtgagcgcc tgttcgccca ggtcgagtac ggagagcagc tccttgttgc 27420 
cgcagacgcg gcacgcggtg gcaatcatgg ggtcctttcg ggatcctggc cggggcgccg 27480 
ccggcccgtg gccaggtcgg gagcttccag acggagggtg tcgggggcgg gccgggggga 27540 
cggcaccagg tgcaggcggc cgatcgcgcc ggtggcggcg gaggcgtcct ggcacgggca 27600 
gggatcgtcg gtgaatccgg cgaagcggta ggccacttcc atcatccggt tgcgttcggt 27660 
ggcccggaag tcggctccga ggtgcacccc ggcccggtgc gcctggtccg tcagccagcg 27720 
caggatcacc gtgccggccc ccagcgacac cacccggcac gaggtggcca gcagcttgat 27780 
ccgccaggcc tcggggccgc gccgcagcag cacgacgccg accgcgccgt agggaccgaa 27840 
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ctcgtcS S f <V Ca 9 ca ? ctc Stggtcgggg tcgtcgatga gggcgcgcag 27900 

ctcgaccca? a^SX* ^ccggtggc gttcatctgg ctggtgcgca gggtcagttc 27960 
alaltaaltt gaCagCtCCa Srgggcgtggc gcggctgatc cgcatccgga tgtccagcga 28020 
cgcctgg'ac Sccf gtcCggtgaa ^cggaccgc tcggcgtccc ggcggaagja 28080 
SS;! ggcgggtcga STtcgacggtg acggtgcccg ggctgaactc 28140 

2 I 9 gtcagccggg tcgcctgctc ggcggcgtag gtgcggacct ccggcagttc 28200 
SS&SSc caaW Cgtt ^ agggctg gtcgtcgatg aaggcgaggg tgcLggcgc 28260 
caSacS aaK g ? Cga tCtCgCggac cgacttcgac ttcgggcccc agccgatcct 28320 
S5??cS- • ^ I? CS ? CgCCgag - ctgttcgagc ttcgcccagg_.cgtgat.cgtg 28380. 
g^cgttcttg ctggccaccg cctgcaggat gccgcgcgcg tccagctcgg tgatggtccg 284*0 

at^ailaa f 9 ^^ ^cctcgtc ctcctcgagg agggtgccc? gLaSggg? 28500 
gtcattccc? ggCatt , tgac caacggctcg gcggcgttgt cccggtgSc 28560 

cccgc^gcca " .^gcggttgc gaccgcgact cctcgacagg gcgtacgcgg 28620 

cccgcggccg gcggggacac gggccggttc acccggccgc ggacatcacg tgcccrcracca 2 86fif) 
9 a lTrTS tC 9CagatCtcg "gctgccct cgatgatctc catgagcttg gcgtSSt 287^ 
S? C g C cc SC a; Cg ; Cgtgt CCCtCCCgCg ccccggccga cgccagcacc ^gcacjgccc 28800 
cca^alcaaa ^cggtggccg cgacgtgctt ggccaggacg gcggcgacca 28860 

ac?^ Cg ^ gCLgCCC ^ C ^ tcccactggg cgct ggcgtg ctcgcacgcc cgggcggcgt 28920 
gcSc™ ctactcccS tCggCgaggt ^ccgggcgac gagctggtgg tccgag^c 28980 
gcgcgccgaa ctgctcccgt ccgccggcgt gacgtgcggc ggcggccagg caggcgcaca 290*0 
ggatgcccag ggagccccag gccaccgaca tccggccgta gctSgcgS gtgSgacca 2^00 
S gg ?S gg ggtgCggtCg tOBCcctflga gcagggcgtc tgccggcag^ cojaccccgt S"S 
ccaggtggat gtC ggcgtgt ccggccgcgc ggcagccgtg cgcgtcggtg a ^ cg ctcga 292^20 
C I C f^ CgCC gggggcCgag gcgggcacca cgacggcgcc cgcgccSgc tccgcgcajc 29280 
cScScttc T^aaial CC cgttggtcgc ccacaccttg acgccgtcga Into 

' g 9 " g :^ gtCg gaggtgatgc ^tgcgcag ggcggacagg tcgctgccgg 29400 

aggcScta Itaaaa^Z aCggCggCCa ^tcgccgcc ggtcaaccgg ggcaccaggg 29460 
t^tcaS? S ™ g ^ccggc gcagcgtcca ggcggccatg ccctgcgagg 29520 
gccggcSS c Cg a^ CS g CtgC3gaggg ^^cgacgtg cgcggtgagt tcgccgttgc 29580 
gccggc.ggt ccagccgagg ccgccgtgga ccgcgggcgc ctgtgcgcac agcaggcccc 296*0 
gggagccgag gtcgtgcagc aggccgaggg g ca g ctcgcc cgLcgJtcc cJctcJacca 297oS 
cccggtcgcc gaccagcgcg gtgaacagct cctcggcctc ggtgccgtcg gcgtgggS? 29760 
SaKcSt car gt9CCC ggtCgCCtCg ccflBBcocflB ccJJccgtcc gaccfgccgg 29 20 
c CC ?a C ot g t Cg ^ g9tgCS gaagtt ^cg agcatcaggt cggcgccgct gatgacga^ 29880 
acScSca ll^ gg l g Cacgac ^ c tgcatggcga acagcga gga catcccgccg 29940 
ta gg * g ZT ggLCCtggtc Srcgctcccag gtggtcttgg tgcggtcctc gaggaacccg 30000 

aacSgtgg tcftScSa ^TT^ ggggtCgtgc -ggtggggtc Jggccgaccg 30060 
gacgucgtgg tcatcgcgtg g cctcctggt agtcgtacgaa tccccggcca ctcttacaac 301 ?0 

cagSPtc C "S ggaCC " gtCCagCa ^agctcgct cgggcggagc g^ggSgc 10 
StaaSa SS^f c ^9cga g t cggccaggtt gtccagtccg atcaggtcjg 30240 
S c 9 S 99 tg ^Stggccga tgcagtcgcg catcagcgcg tccacggtc? 30300 
^ ggg ^ gg ^ cc ^ ccc tcg tgcaccaccg cgatggcgtc gttcagcatc cggtgcagca 30360 
S 99 cZr 9 gCgCCgtCgc cgacoacgat gccccggcgg c^ajgc^gg 30420 
cgaccaSS SrfT CgggCggccg cctctccgct gcgcggtccg aggaccacct 30480 
cgaccgtggg gatcacgtac gcggggttca tgaagtgcac gccgacaaag tcctcgggac 30S*0 

tosses ^olTa^ ^ tC ^ ^cccga ggtgttgctg acgagSJSg 0 o 
cggSSac ^ gCCaggtccg ccagcacctc ggccttccgc tcggggtcct 30660 

tcaa gaC ^ C ^ tCgatCacg Sfcggtcgcgg tggcgacggc ggccggcgcc tcctcgacag 30720 
acaScaac far^r"^ tCgtggggca ^gcgcccat cagccgggcc gtccgcaga? 30780 
9 2 c c a gC S C a ggg gCggCCgCgc ^cgccccggc ggaggtgtcg accagtgtga 30840 
^ gg L; gtgtCCgacg S c sagtgccg cgatggccgt gcccatgacg cccacgccga 30900 
gcacgacgag cggagaattt tccttggaat cgggcacgga tec 30943 

<210> 2 
<211> 11171 
<212> ADK 

<213> Streptomyces ambof acier.s 
<400> 2 

ctgcaggcgc gegggctget egggcaggag gcgcccgccg agagectega cgegatgate 6 0 
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gacgactact gcgcgcagat ccgcgaggtc cagcccgagg gcccgtaccg gctgctcggc 12 0 
tggtccatgg gcgggctgct cgcgcaccgg gtcgccaccc gcctccagcg ggcggggcag 180 
cgcgtcgacc tgctcgcgat cgtcgacgcc tatccgcccg cctcggtgcg ggccgactgg 240 
gacgcggcgg agatggtggc gcggatcggt gaggaactgg gcttcgacgt ggaccgggtc 3 00 
ggccccggcc aggaggaggc gctgctcgcg gatctgcggg cgaaggggca tcccctgggg 360 
catctgccgg gcggtgacat cggcgcggcg gtccgcgtgt acgtcaacag ctcgcgcctg 42 0 
acgaggaacc tgcggcccga ggcgttcgac ggggacgtcc tcttcttcgc ctccgggacc 480 
tcgttcgccg aggacgacca ggttcacgac gtcgccgcct ggcggccgta cgtcaccggg 540 
cagatcaccg agcacgtgat cgaccacctc cacgaggacc tcttgatcga accggccgcg 600 
gtcacggcca tctccgacgt gctcgtcggg catctgcccg cggacgacac accccgcgcg 6 60 
tccggcgcac cccgcgcacc tcgcgcatcc cgatgaggaa ggaaacatca tgagcaaccc 72 0 
gttcgaggac acggaagcca cctacgtcgt gctggtcaac gacgaggggc agcactcgct 780 
gtggccgtcg ttcgcggagg tcccggcggg ctggtccgtc gtggtgccgg agacggaccg 84 0 
gcagtcgtgc ctggactaca tcaacgagaa ctggaccgac atgcgcccca agagcctcgt 9 00 
cgaggcgatg gcgacggccg ggcaggacgc cccttgagcc aggacgccat gatccgggcg 9 60 
gtcggcgtcc gcaagagctt gcggcgacgt ccacgccctc gacggcgtgg acatcgaggt 1020 
cgaacggggc cgggtgctcg ggctgctggg tcacaacggg gccggcaaga cgaccttggt 1080 
gaacatcctt gccacggtct ccccggcgtc cgcgggcacg gtgaccgtcg ccggtttcga 1140 
cgtcgcgacg cagggcgccg agatccgcgc gcgcatcggg gtgaccggcc agttcgcgtc 12 00 
ggtggacgag tacctgagcg gattccgcaa cctcgtcctg atcggccgcc tcctcggggc 12 60 
gggacggcgt gaggcggcgg cccgggccac cgagctcctg gagctgttcg agctgaccgg 1320 
ggcggcccac cagccctccc gcacctactc gggcgggatg cgccgacggc tcgacctcgc 13 8 0 
cgccagcctg gtcggccggc cggacgtgct gttcctcgac gagccgacga ccgggctgga 144 0 
cccggcgacc cggatcgccc tgtgggagac ggtggagaag ctggtggcgg gcggcacgac 15 0 0 
cgtcctgctg accacccagt acctggacga ggcggaccgg ctggccgact ggatcaccgt 15 60 
cctgtcgaag ggccgggtgg tggcctcgga caccaccgac cggctcaagg ccgacctggg 162 0 
ccaccggtcg gtgcgggtgg tccttccgcc cgccgccgac ctgacggccg ccgccgccgc 1680 
gctcaccgcc ggcgggttcc gtccgcggtc cgacgccggg gagcacgcgc tgaccacgcc 17 40 
cgtggacacc tcggccggta tcgcgggcgt catccgcgcg ctggacaccg tcggaacgca 1800 
ggccgtcgag ctgaccgtca aggagccgtc cctggacgac gtctacctgg cgctcaccca 1860 
tccctcaccc gccgccgacg cggcctgatc cccaggagtt ccgttggcca tccaggagcg 1920 
cgccgtgaag gaggtggcgg tcgacaccgg taccccggcc ggccccgtgt ggcgtggtgc 19 80 
cggcctcggc acccagctgt gggtactgac cgcgcggcag atccgttcca tgtacggcga 2 040 
ccgccgcctg gcgctgttca gcctgatgca accggtgatc atgctgttgc tgctgagcga 2100 
gatcttcggc agcatggccg acccggacga cttcccgcag ggcgtgcgct acatcgacta 216 0 
cgtggtgccc gcgctgctgg tcaccaccgg catcggctcg gcccagggcg cgggggtggg 222 0 
cctggtcagg gacatggaca acgggatggt ggcgcgcttc cgcgtcctgc cggcccggct 2 2 80 
gttcctggtg ctggtcgccc ggtcgctggc cgatctggtc cgtgtgttca ccgagttggt 2340 
cgticctcgtg gccgtcggtg tgatcctgct gggcttccgt ccggccgggg gtttgtgggg 2400 
cacgtccgcc gccctgttgc tcaccctgtt cgtcatctgg tcgctgatct gggggttcat 2 460 
cgccctcgcg gcgtggctgc gcagcgtgga ggtgatgtcc agcctcgcgg ttctggtgat 2 52 0 
gttcccgctc atgttcgcct ccagtgcgtt cgtcccgctg gacgccctcc cggagtggct 2 580 
gcgctcggtg gcgcacctca accccgtgac gtacgcggtc gacagcgccc gccgcctggc 2 640 
gctggactgg gacccggggt ggagcgtgcc cggcgcgctg ctgaccagca ccgcgctcat 27 00 
ggcggtgggg atgtacgtcg ccgggcgttc cttcaagagg cccccgaacg aatgattccg 2760 
gcgaacgggt ccgtcgcctg cccctccggg ctcgcccggg ggaggcgggc gcggtctcag 2 820 
cggtcggccg tccgcccgta ggcgcggaag agtgcggtcc actccgggac cgtgaggtcc 2 8 80 
ttgacccggt cggccggcct cacgcccgcc ccgcgcacga actgggcgtg tccgcggcgc 2 94 0 
agcaccttcc gcgcggcgtc gcccaccgtc atctggccgg tgtcgaagac ccgttggacg 3 000 
aaccgctggt aggcggcctt ctcacgccag ggcacggacg gcctgcggtg cggggcgacc 3 060 
atcagggtct gggtgtccgc gcgcggtacg ggggtgaagt cctggcgtga gaaggccagg 312 0 
ccccggtcga acgagtacca cggctcccac tgggcgttga agaggtttcc gccccaggct 3180 
ccggtccgct ttcccacgta ctcccgctgc aacaggaaca cgccctgccg catgcgcgcc 3240 
ggacccatgt cgaggcagcg cctcagcatt ctggtgccgg tgacgaaggg aagattcccg 33 00 
atgagtctga ccggctgccc gggcagttgc agggtcagga aatcctcgtt caccaccgtg 3360 
acgtccggca gcgattcggc ggccagccgc cgagcccagc ggggatctat ttccaccgcg 342 0 
agtaaaggcg tcccgggtga ggcgagcact ttggtcaccc gccctgatcc cgcgcctatt 3 480 
tcgacggtca tcaggtcatt cggagaatcg ggcggaatgg tgtccgaacc gtccagctga 3 540 
gcggagaaac gacaggccgc ggcggctgta cgaaagaagt tctgacccca ttctctccgc 3 600 
gcggtgctgc gtgaatcagc gggtgcggag acggattgcg gtggcagtgg ggatttcaat 3 660 
gtcacctcgg cgacattacc aagtcttgac ccaacggtcc atcaaccacc ggtatacccc 3720 
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SSS ITcTcZZ ccggaa^ce Cg * Cgttcgg ccgcgggcct ttcgggcccg 3780 
cacagtctcg tcgg^gcl ™^ ^ cggcgatatt tccggctcct ggcgactcgc 38*0 
tcgtLggtc cgSggStec c " Sf g9ggCgattC ^ggccgact 3900 

gcgggttgtc ggccaaa a Zcr f^ggccgat ggccgctgac tgtgtcatct 3960 

cgaccccggt cccaccccca alll aggatgactc agccgttcct gcggtcgtcc 4020 
gtcgtcactc accagcctcc gctSaSS " gagS f tCCa ^gctccagc gcgtcgatct 4 080 
ccagcagggc ttc^cgccg acSSaat lltl ^ gtattcgcct gtcacatcgc 4140 
cggttccatg gcggtc^cga tcSct??S gggcagc ^ ca ctgctgcaca tcaccccgct 4200 
- - ccgcgacgag gaSccgMc S c actgagtgga trcgtcctcg ectggtcgge 4260 

gcatctcgcg- acgtSgca- tc^tc? S??2tS t-c^f^ tCtatCCgCt "20 
tcccggcggt tccgtatcrcra aMn^^ ca.cautttc .ccc.gtcgg agccggtact 4380 
tcccgacgcg accctcacgg ccSSoL 9CCCaatgtt "gctcgtgc agtcctggct 4440 
cgccttctat ctgtcgttcc cgc^taata f'TT ^^tct cctgtgagat 4500 
gctgtggtgg tgjgcfcrcgg ZtcS" ^cggctggtg cgcaggattc ccgcacggcg 4560 
cctgctcccg gcgagcgaSg StSr ggCCgtgac 9 tgtgtgcccc tgctggcggg 4620 
gtactggct? LSccggSc gStaSaaa 2?°*^ CtCaac ^9 tctggttcgc 4680 
cctgcgcgcg gaJatSa aaaar^™ ST-tcgtcctc ggcatcgtga tggcgctgat 474 0 
gagttacggc c^cacccSa tSSgcccS tgca f gg <^ ^cctcgccgc 4800 

accggccgcg ctgctgatca caalllttZn gatCttCacc ctcgtcgcct gctccgtcgt 4860 
gctgcgttcg gcjacgctaa SI 9 ^cgccgac gtgcacggcc ggcgcacggg 4920 
cttcctgat? atcSctaca IIT* *** CCagtggtcc ttcgccttct acctggtc^ 4980 
gtggagcac^ ccggccgS locate If^^ gatCtgggCt W W ca 5040 
eggeggtctg ctjcacaccg g j f 9 ct S™gtgg cggtcctggc 5100 

gtccgcctcc cgtccgaag? cSSccac nT, 9 Cgcctgttc 9 S^agccgcag 5160 

cgcggccggc g'gcccctjc tccSgSt ac Si cg ^ aactc ^ ccgcggccga 5220 
gaacgaaccc accccgagaa gatgfSaac Znf gcgcacacc = ccgcagcgac 5280 
ctgctggagt acgcccgaag ^tcjeac^a ™ ^ agaCg S ctct <=agccccgcg 5340 
gaggtgaccg cc^ggcSc cggcgglcgj gccSgcaSa <^ aa ^cac 5400 

ttcctcgccc tgctgatccg actcafra!f 9 cc atgcaga tcatgcccga ggaggcgcag 5 460 
aeggggtaca geaegctata L2' 9? S^ggcggg tgctggagat cggcaccttc 552Q 
tgegacatea gcgaSgtg accSgcafc a"^" 9 CCgaCggCac cgtcgtcacc 5580 
gagtccegga tcgacc^cg StcSgSc accSo^ aCtggc ^ c ^ ggccggggtg 5640 
cacgaggggg aeggctegt? Sacctaatr f^ g 5 CCgga ccctc ^cga gctccgcgag 5700 
cactactacg ag^ageget ggccctSta ca^ 093 " 9 ° CgaCaagac cgggtacccg 5760 
accctgttct tegg^egggt ooccaa™ c ^ccc g gcg gactggtggc ggtcgacaac 582 0 
cgcgcgctca aegageget gcacaacaS 9CCgtCgagg acgccgacac cgtcgccgtg 5880 
gecgaeggga tcactcSgc LgccggSg SSSS™ acatcgccct getgaeggtc 5940 
ggtgccgtca ccgacccgca Sctr^ Sag.gagtcc geaeggggtg cggagcacct 6000 
ctgccctggc gtjgccagcj ctcgSaa gCCgaCCtgc ^gggcaggt cgccgagctg 6060 
gtcgatgtgc cg^cccSct tctStSS 2™ Cagcg ^acc 3flrttgatc ff c 6120 
gcagagcacg ccgacct?gc aSa^" agCCCCtCCg tgggcgccag 6180 

cgtgtcggcc agcgggtaL tgcSSS ^ aCgtCgt ^ ca cggcaaccgc 6240 

ccggttcgcc tcc2£ge£ c l? W atc ^cccct tggegacgag 63 00 

gtgcatccag aggtag^ggt tgtcgaactc SaScaSf gt ^acga tacgettgag 63 60 
gaegategtg ccgcccc gc a^Sacata llll " 9 Ccc ^gt gg aggegcaggt 6420 
gtgctcgaag acgatgtcga cSccfof^ gaCggacgcc ^gaaggtct cccggccggg 6480 
gcgcttccac tcccgS££ SggaSte r^T ^ tCgCggatgc ^ttgccgaa 6540 
ggageggteg atga£S ^ Cagaa ^ggt agtcctcggc 6600 

ggagaccacg cagaeggggt S^cccggcac acctcggcct tgcgcgcgct 6660 

caggccgcc? ctggcgcS aaatcaSac ggCgagggCC a ^tgggtgg cgtacgagcc 6720 
gegggagace age^ggeggt JggcgaSa gt , tgtCgCCC tgcttcatgc cggcgccgtt 6780 
ccaggtcaga tgggSLS tgggSSa ^ g ^ C3ga CCgggcgc ^ cggcctcctc 6840 
caggcccccg aigJtagtct cgaagcccS Ltf ttgacga S^ ^cacctcggc 6900 

gtcgtgcccg tegggg^tet 9 at 9 c ^tgg geegggtega gcatggtgtc 6960 

gggtttccag acSScgc cgacagacag tgegegaega cctcgtcacc 7020 

gaggatgtgg ta^ggcaggt 2 gc ^ ca 9 ca <=c acgccggaca ggteggaace 7080 

caggaagecg aac^eggaa gJggctlSa aaTa^ 90 gaggtgcgcc cgtagcgctc 7140 
ggagctggcc atcLcgcga ccS^cctc Tara^"^ CagaCCgtgt tgtagttgac 72 00 
gtcgaegtae aagoacttS "1^,, cccgggcccc acttegggea gcggcacctc 72 60 . 
ggtgtclt^t ttg^aaegg ? ^tccgcgctc ggcatcccgc ggaacatgtc 7320 

geggaegg .Cocggcgcg gaaggactcg ggcaggggca gcgccgcgat 7380 
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gtcctcgggg gtgcggtccg cggcggtgat cgcggcgagc agcgcgctct gcgcatggct 744 0 
ttcgggcatg gaacggtctc cgatcgctcg tgtcgtcagg tggcccggtg cagggcggtg 75 00 
aggcgctcca gggtggggat gatcccggcg ggcgtggggt cggcgagcat ctcctcgctc 7 5 60 
agccgccgcg cgcccgccct gatcgcgggg tcgtgcacgg ccgtgtgcac cgcgtcggcc 7620 
agaccgcgcg ccgtgagcgt cgccgcgggc aggtcgaacc cggcggacag gcgctggagt 7680 
tgctgcgcct tgagcggcgc gtcccacagg gagggcagca ggatctgcgg cactccgtgg 77 4 0 
cgcagggcgg tggaccaggt gcccgctccg ccgtggtgga tgatcgcggc gcagctcggc 7800 
agcagcgcgt cgagcggtac gaagtccacg ggcacgacgt tgtcggggag ggtgcccagg 7860 
cggtcgagct gggaggtgtc cagggtggcc accacctcga tgtccagccg gccgagcgcc 7920 
tccagcagtt cggagtagga gaccgcgtcg cggccgtagg tctcgcgggc ggacacgccg 7 9 80 
agggtgaggc agacgcgggg gcggtcgggc ttcttgccga gccagggttc gatcacggag 8040 
cgcccgttgt agggcacgta gcacatgggc accgtggtct ggcccaggtc gaggcgggtg 8100 
ctgcgcgggc ccgggtcgat cacccagtgg ccgagcacgt cgcgttcgtc gaaggcgagc 816 0 
ccgtaccggt ccagcgtcca gccgagccat tcggcgatgg ggtcctcgcg cagttcctcc 8220 
ggcatcccgt cgagggcggc gaggaagcgc aggcgggagc gtccgatggc gtcggggccc 82 80 
cacaggatgc gcgcgtgggc ggcaccgcag gcgcgggccg cgaccggccc cgcgtaggtc 8340 
cagggttccc acacgaccag gtcgggccgc cagccacggg cgaagtcgac gatctcgtcc 8400 
atcgtggcgg cgccgttgaa cggggcgaag cacagggcgg ccatcatgct ctgctggccg 8460 
agcaggtact cccaggtggt ctcctcctcg ctctccacct caccgaactc gaagccccgc 852 0 
tggtagggga cgaggtcgct gcccatctcg gcgagcagct ccgcggccgg tcggtcgtcg 8580 
cccaccggta cggcggtcag gccggtggag gtgatgacgt cggtgaggga gggcgggctc 8640 
gccacccgta cctcgtgccc ggcggcgcgc agcgcccagg cgaggggcac cagactgtag 8700 
tagtgggtgt tgtgggcgag ggatgtcagc aggacgcgca cagcggctcc ggtctgggag 8760 
ggggcgtacg gacggcgggg tcatcccggg tggacccgga ggcgggcgca ggcgcccagg 8 82 0 
accggtgacc gcggccgggt caggggcggt ccctcggccc gcaggccggg caggcggccg 8880 
gccgtgacct ggaccgcggt ggtggcggcc aggcggatca gcgggagggc gagcgccagg 8940 
tgcggtccgt cggcgccccc gagcggctcc ggcccgggga tctcccgtcc ggcggcggcc 9000 
agcaccacga cgtgctcgtc ggcggtgatc cggcggccgc cgagttcgag gccggtgtgc 9060 
gcgacccggt tctccagccg ggccgggggg cgctcgcgca gcacctggtc gacggcgttc 912 0 
gccgcggccg gcgtccggcg ggccctctcc cactcccccg gccggccgag cagccggtgg 9180 
accgtgtgcg cgacggcggt gacgacgggt tcgggtgcgc cgaccgcgag gagcagcgcg 9 240 
atgcgctcga cgtcgccggg ggcgacgccg tcgtgcagga ggagggcgag cacgtcgtcg 9300 
ggccggggct cggcgttccc gaggccccgg gacttctccg cgacgagctc ggggaccagg 9360 
tcggccagtg tgcggacggc gtcggcggac tcccgggcca cggtcagcag ttgcggggcc 9 42 0 
atccgggcgt cgagctgggg gccgcaggcg gcgagtgccc gcgcggcggt ggcgcggtcg 9480 
cggcccggca ctccgaggag cctgagcatc agctcgacgg cgtagggccg ggcgacctcg 9540 
ccgacaaggt cgaacccggc gtcaccggtg ggcagcaggc ggccgagcac tctgcgggcg 9 600 
gtggtgcgcg ccgcgcaggg cgcctgggcc ggggcgtacc ggctgagcac cggggcggcc 9 660 
agcgcccgca ggcgtacgag ctccgcgcgt tcgtggtggg ggaacgcctc ggcgaggggc 9720 
agcagttcct: cgtccgggcg gcgtccggcc cggtccagcg tgccgaagcg cgggtcggcc 9780 
aggacggccg ccgccacctc ggggtccgcg gtcacccagg cgtccagctg ttcgctgcgg 9 840 
aaccacggtc cgcgggcccg gatctcccgt tcgaacggct cggggtcggc gacggcgcgc 99 00 
aggatcagcg cgtacgggtc gccctggttg ccggcgcacc agtgtgcggc ccgggtcagc 99 60 
tggagccgac ggccgagcgc acggacgccc gtgctcgtgt ccgcgctcgt gctcgtgctc 10020 
gcgggggccg tttccgtggc aagggtgggc atggctgccc tgcctttctt ctcgggtcga 10080 
tgggggcgct cgcacgatcg ggggacccgg gtgtgccggg tgggtcgggg caacccgcct 10140 
ccgggccgcg gcggtccgcg tcggcaccgg gtcagcggcg ggtgccgatg aacagcccgc 102 00 
gaccggacgg gccgccttcc tggtagacca cgtcgcagcc ggcgcgctcg aaggccgcct 10260 
cgtagtcggc gcgcgggaac agggtgatgg tgtggtcctc ggtcaggtga cggacgccgc 10320 
cgggtccggc gaggaggtag tgcacctcga tgcgggtggc gttcccctcc cgtacggagt 103 80 
gcgagacccg gcagacggtg cgctcgcccg cctccgtgat gctggcgccg acgtaaccgg 10440 
gggtgaagga ctcggggaac caccagggtt cgacgacgat gacgccggac ggttcgaggt 10500 
ggtcggtgaa ggcccgcagc gtgctgtcga gttcgtcggt ggtccgcagg tggcctatgg 10560 
agctgaacat gcaggtcacc gcgtcgaacc ggcgtcccag ggagaacgag cgcatgtccc 10620 
cttggtggaa ggtgacaccg gggttccggc cggtcgcgag ggccagcatg tcggcggaga 10680 
gttccaggcc ctcgacgtgg tcgaagaggc cgtccaggtg gtgcaggtgc tggccggtgc 10740 
cgcaggccac gtcgagcagg gtccgggcgc ccggccggtg gacgcgcacg agtgcggcga 10800 
tctcctcggc ctcctgccgg tagtccttcc ccttcccctc gtggaccagg tcgtagacgg 10860 
ccgcgatgtc gtcggcgcac atcagtgttt ccctccggtg agcggggcgg gaccgggctg 10920 
gtgcgggagg ctgtccagcc attcgtgcac cagggacgcg gtgtgccggg cgtgttcggt 10980 
gagcatggtg aagtggttgc cgggcacgtc ggcgacggtc cgtgcgaacg ggacctggga 1104 0 
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ccgccagtcg ccccgcgccc cgcccgcggg 
ggccagcagg acgggggctt cgagggcggt 
gccggccatg g 



cggccacgcg cacaggggtt cggacgcccg 11100 
gagccgggtt ccgagcacca gccgctgata 11160 

11171 



<210> 3 
<211> 711 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (711) 



<400> 3 

atg tac gcc gac gac ate gcg gec gtc tac gac ctg gtc cac gag gga 

Met Tyr Ala Asp Asp He Ala Ala Val Tyr Asp Leu Val His Glu G^v 

1 5 10 " 



48 



15 



c.ag ggg aag gac tac egg cag gag gcc gag gag ate gcc oca etc ata 96 
Lys Gly Lys Asp Tyr Arg Gin Glu Ala Glu Glu He Ala Ala Leu Val 
20 25 30 

ego gtc cac egg ccg ggc gcc egg acc ctg etc gac gtg gcc tgc ggc 144 
Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Ast> Val Ala Cys Glv 
35 40 "45 

C f g CaC Ctg cac cac ct ^ Sac ggc etc ttc gac cac gtc gag 192 
Thr Gly Gin His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu 
30 55 60 

riZ rll ri* T CtC o CC gC ° 9aC 3tg Ctg gCC Ctc ^ cg acc ^ c c ^ aac 240 
Gly Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr G] y Arg Asn 

6:5 70 75 80 

P^n r?i ffi ^° Ca ° 9Sg gaC atg cgc tc ^ ttc tcc c tg gga 288 

Pro Gly Val Thr Phe His Gin Gly Asp Met Arg Ser Phe Ser Leu Gly 

85 90 95 

til til ll C T° f? 9 gtg aC ° tgC atg ttC agc tcc ata ^ cac ctg 336 
Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser He Gly His w 

100 105 H0 

S ?S ^ C f C CtC gaC a9C aCg Ctg Cgg gcc ttc acc ^ ^ 384 

~rg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp H^: s 

115 120 125 

etc gaa ccg tec ggc gtc ate gtc gtc gaa ccc tgg tgg ttc ccc gag 432 
„eu Glu Pro Ser Gly Val He Val Val Glu Pro Trp Trp Phe Pro Slu 
130 ■ 135 140 

111 ™° - CC ?f taC gtC ggc gcc agc atc 5C 9 9cg ggc gag 480 

Ser Pne Thr ,ro Gly Tyr Val Gly Ala Ser He Thr Glu Ala Glv Glu 

^ 45 150 . 155 " 160 

tla c g ° tCS CaC tCC gta Cgg gag ggg aac 9 CC acc 528 

Mg Ihr Val C V S Ar 9 v al Ser His Ser Val Arg Glu Gly Asn Ala Thr 
165 170 175 

lit Tit nil X? ^ C CtC CtC gCC gga CCC ggC ggC gtc c ^ cac 576 

A.g lie Glu Val His Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His 
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180 

ctg acc gag gac cac acc 
Leu Thr Glu Asp His Thr 
195 

gcg gcc ttc gag cgc gcc 
Ala Ala Phe Glu Arg Ala 
210 

ccg tec ggt cgc ggg ctg 
Pro Ser Gly Arg Gly Leu 
225 230 



185 

ate acc ctg ttc ccg cgc 
He Thr Leu Phe Pro Arg 
200 

ggc tgc gac gtg gtc tac 
Gly Cys Asp Val Val Tyr 
215 220 

ttc ate ggc acc cgc cgc 
Phe He Gly Thr Arg Arg 
235 



190 

gcc gac tac gag 624 

Ala Asp Tyr Glu 

205 

cag gaa ggc ggc 672 
Gin Glu Gly Gly 



tga 711 



<210> 4 
<211> 236 
<212> PPvT 

<213> Streptomyces ambof aciens 
<400> 4 

Met Tvr Ala Asp Asp He Ala Ala Val Tyr Asp Leu Val His Glu Gly 
1 ' 5 10 15 

Lys Gly Lys Asp Tyr Arg Gin Glu Ala Glu Glu He Ala Ala Leu Val 
20 25 30 

Arg Val His Arg Pro Gly Ala Arg Thr Leu Leu Asp Val Ala Cys Gly 
35 40 45 

Thr Gly Gin His Leu His His Leu Asp Gly Leu Phe Asp His Val Glu 
50 55 60 

Glv Leu Glu Leu Ser Ala Asp Met Leu Ala Leu Ala Thr Gly Arg Asn 
65 70 75 80 

Pro Gly Val Thr Phe His Gin Gly Asp Met Arg Ser Phe Ser Leu Gly 
85 90 95 

Arg Arg Phe Asp Ala Val Thr Cys Met Phe Ser Ser He Gly His Leu 
100 105 HO 

Arg Thr Thr Asp Glu Leu Asp Ser Thr Leu Arg Ala Phe Thr Asp His 
115 120 125 

Leu Glu Pro Ser Gly Val He Val Val Glu Pro Trp Trp Phe Pro Glu 
130 135 140 

Ser Phe Thr Pro Gly Tyr Val Gly Ala Ser lie Thr Glu Ala Gly Glu 
145 150 155 160 

Arg Thr Val Cvs Arg Val Ser His Ser Val Arg Glu Gly Asn Ala Thr 
165 170 175 

Arg He Glu Val Kis Tyr Leu Leu Ala Gly Pro Gly Gly Val Arg His 
180 185 190 

Leu Thr Glu Asp His Thr He Thr Leu Phe Pro Arg Ala Asp Tyr Glu 
195 200 205 

Ala Ala Phe Glu Arg Ala Gly Cys Asp Val Val Tyr Gin Glu Gly Gly 
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210 215 220 

?r ? Ser Gly Arg Gly Leu Phe Ile Gly Thr Ar 9 ^9 
225 230 235 



<21C> 5 
<211> 1272 

~<2-l-2>—Af)N- — — — — — — — ~ 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1272) 

<400> 5 

atg ccc acc ctt gcc acg gaa acg gcc ccc gcg age acg age acg age 48 

Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser 
1 5 10 15 

gcg gac acg age acg ggc gtc cgt gcg etc ggc cgt egg etc cag ctg 9 6 
Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gin Leu 
20 25 30 

acc egg gcc gca cac tgg tgc gcc ggc aac cag ggc gac ccg tac gcg 144 
Thr Arg Ala Ala Kis Trp Cys Ala Gly Asn Gin Gly Asp Pro Tyr Ala 
35 40 45 

ctg ate ctg cgc gcc gtc gcc gac ccc gag ccg ttc gaa egg gag ate 192 
Leu lie Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu Ile 
50 55 60 



egg gcc cgc gga ccg tgg ttc cgc age gaa cag ctg gac gcc tgg gtg 
Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gin Leu Asd Ala Trp Val 
65 70 75 



80 



240 



288 



336 



acc gcg gac ccc gag gtg gcg gcg gcc gtc ctg gcc gac ccg cac ttc 
Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe 
85 90 95 

ggc acg ctg gac egg gcc gga cgc cgc ccg gac gag gaa ctg ctg ccc 
Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro 
100 105 110 

etc gcc gag gcg ttc ccc cac cac gaa cgc gcg gag etc gta cgc ctg 3 84 
Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu 
115 120 125 

egg gcg ctg gcc gcc ccg gtg etc age egg tac gcc ccg gcc cag gcg 432 
Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gin Ala 
130 135 140 

ccc tgc gcg gcg cgc acc acc gcc cgc aga gtg etc age cgc ctg ctg 480 
Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arc Leu Leu 
145 150 155 * 160 

ccc acc ggt gac gcc ggg ttc gac ctt gtc ggc gag gtc gcc egg ccc 528 
Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro 
165 170 175 
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tac gcc gtc gag ctg atg etc agg etc etc gga gtg ccg ggc cgc gac 576 
Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp 
180 185 190 

ngc acc acc acc gcg egg gca etc gcc gcc tgc ggc ccc cag etc gac 624 
Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gin Leu Asp 
195 200 205 

acc cga atg gcc ccg caa ctg ctg acc gtg gcc egg gag tee gcc gac 67 2 
Ala Arg Met Ala Pro Gin Leu Leu Thr Val Ala Arg Glu Ser Ala Asp 
210 215 220 

gcc gtc cgc aca ctg gcc gac ctg gtc ccc gag etc gtc gcg gag aag 
*la Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lys 
225 230 235 240 

tec egg ggc etc ggg aac gcc gag ccc egg ccc gac gac gtg etc gcc 
Ser Arg Gly Leu Glv Asn Ala Glu Pro Arg Pro Asp Asp Val Leu Ala 
245 250 255 

etc etc ctg cac gac ggc gtc gcc ccc ggc gac gtc gag cgc ate gcg 
Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg lie Ala 
260 265 270 

ctg etc etc gcg gtc ggc gca ccc gaa ccc gtc gtc acc gcc gtc gcg 
Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala 
275 280 285 

cac acg gtc cac egg ctg etc ggc egg ccg ggg gag tgg gag agg gcc 
Kis Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala 
290 295 300 

cgc egg acg ccg gcc gcg gcg aac gcc gtc gac cag gtg ctg cgc gag 
*rg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gin Val Leu Arg Glu 
305 ~ 310 315 320 

cgc ccc ccg gcc egg ctg gag aac egg gtc gcg cac acc ggc etc gaa 
Arg ^ro Pro Ala Arg Leu Glu Asn Arg Val Ala His Thr Gly Leu Glu 
325 330 335 



720 



768 



816 



864 



912 



960 



1008 



etc ggc ggc cgc egg ate acc gcc gac gag cac gtc gtg gtg ctg gcc 1056 

Leu Gly Gly Arg Arg lie Thr Ala Asp Glu His Val Val Val Leu Ala 

340 345 350 

gcc gcc gga egg gag ate ccc ggg ccg gag ccg etc ggg ggc gcc gac 1104 

Ala Ala Gly Arg Glu He Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp 
355 360 365 

gga ccg cac ctg gcg etc gcc etc ccg ctg ate cgc ctg gcc gcc acc 

Gly Pro His Leu Ala Leu Ala Leu Pro Leu He Arg Leu Ala Ala Thr 
370 375 380 

acc gcg gtc cag gtc acg gcc ggc cgc ctg ccc ggc ctg egg gcc gag 

Thr Ala Val Gin Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu 

385 390 395 400 

gga ccg ccc ctg acc egg ccg egg tea ccg gtc ctg ggc gcc tgc gcc 1248 

Gly Pro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala 



1152 



1200 



405 410 415 

cgc etc egg etc cac ccg gga tga 



1272 
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Arg Leu Arg Val His Pro Glv 
420 



<210> 6 
<211> 423 
<2I2> PRT 

<213> Streptomyces ambof aciens 



< 4~0~0 > ~™6 ~~ ~~ ~ ~~ ~~ ~~~~ ~~ ~ ~ ~ 

Met Pro Thr Leu Ala Thr Glu Thr Ala Pro Ala Ser Thr Ser Thr Ser 
15 10 15 

Ala Asp Thr Ser Thr Gly Val Arg Ala Leu Gly Arg Arg Leu Gin Leu 
20 25 30 

Thr Arg Ala Ala His Trp Cys Ala Gly Asn Gin Gly Asp Pro Tyr Ala 
35 40 45 

Leu lie Leu Arg Ala Val Ala Asp Pro Glu Pro Phe Glu Arg Glu lie 
50 55 60 

Arg Ala Arg Gly Pro Trp Phe Arg Ser Glu Gin Leu Asp Ala Trp Val 
65 70 75 80 

Thr Ala Asp Pro Glu Val Ala Ala Ala Val Leu Ala Asp Pro Arg Phe 
85 90 95 

Gly Thr Leu Asp Arg Ala Gly Arg Arg Pro Asp Glu Glu Leu Leu Pro 
100 105 110 

Leu Ala Glu Ala Phe Pro His His Glu Arg Ala Glu Leu Val Arg Leu 
115 120 125 

Arg Ala Leu Ala Ala Pro Val Leu Ser Arg Tyr Ala Pro Ala Gin Ala 
130 135 140 

Pro Cys Ala Ala Arg Thr Thr Ala Arg Arg Val Leu Gly Arg Leu Leu 
1" 150 155 160 

Pro Thr Gly Asp Ala Gly Phe Asp Leu Val Gly Glu Val Ala Arg Pro 
165 170 175 

Tyr Ala Val Glu Leu Met Leu Arg Leu Leu Gly Val Pro Gly Arg Asp 
180 185 190 

Arg Ala Thr Ala Ala Arg Ala Leu Ala Ala Cys Gly Pro Gin Leu Asp 
155 200 " 205 

Ala Arg Met Ala Pro Gin Leu Leu Thr Val Ala Arg Glu Ser Ala Asp 
210 215 220 

Ala Val Arg Thr Leu Ala Asp Leu Val Pro Glu Leu Val Ala Glu Lvs 
225 230 235 240 

Ser Arg Gly Leu Gly Asn Ala Glu Pro Arg Pro Asp Asd Val Leu Ala 
245 250 255 

Leu Leu Leu His Asp Gly Val Ala Pro Gly Asp Val Glu Arg lie Ala 
260 265 270 
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Leu Leu Leu Ala Val Gly Ala Pro Glu Pro Val Val Thr Ala Val Ala 
275 230 285 

His Thr Val His Arg Leu Leu Gly Arg Pro Gly Glu Trp Glu Arg Ala 
290 295 300 

*rg Arg Thr Pro Ala Ala Ala Asn Ala Val Asp Gin Val Leu Arg Glu 
305 310 315 320 

Ara Pro Pro Ala Arg Leu Glu Asn Arg Val Ala Kis Thr Gly Leu Glu 
325 330 335 

L~u Gly Gly Arg Arg He Thr Ala Asp Glu Kis Val Val Val Leu Ala 
340 345 3b0 

*la Ala Gly Arg Glu He Pro Gly Pro Glu Pro Leu Gly Gly Ala Asp 
355 360 365 

Gly ^ro His Leu Ala Leu Ala Leu Pro Leu He Arg Leu Ala Ala Thr 
370 375 380 

Thr Ala Val Gin Val Thr Ala Gly Arg Leu Pro Gly Leu Arg Ala Glu 
385 390 395 400 

Gly ^ro Pro Leu Thr Arg Pro Arg Ser Pro Val Leu Gly Ala Cys Ala 
405 410 415 

Arg Leu Arg Val His Pro- Gly 
420 



<210> 7 
<211> 1266 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1266) 

<400> 7 

gtg cgc gtc ctg ctg aca tec etc gec cac aac acc cac tac tac agt 

Val Arg Val Leu Leu Thr Ser Leu Ala His Asn Thr His Tyr Tyr Ser 
15 10 15 

ctg gtg ccc etc gec tgg gcg ctg cgc gec gec ggg cac gag gta egg 
Leu Val Pro Leu Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Arg 
20 25 30 

gtg gcg age ccg ccc tec etc acc gac gtc ate acc tec acc ggc ctg 
Val Ala Ser Pro Pro Ser Leu Thr Asp Val He Thr Ser Thr Gly Leu 
35 40 45 



48 



96 



144 



acc gee gta ccg gtg ggc gac gac cga ccg gee gcg gag ctg etc gee 192 

Thr Ala Val Pro Val Gly Asp Asp Arg Pro Ala Ala Glu Leu Leu Ala 
50 55 60 

gag atg ggc age gac etc gtc ccc tac cag egg ggc ttc gag tte ggt 240 

Glu Met Gly Ser Asp Leu Val Pro Tyr Gin Arg Gly Phe Glu Phe Gly 

65 70 75 80 
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gag gtg gag age gag gag gag acc acc tgg gag tac ctg etc ggc cag 

Glu Val Glu Ser Glu Glu Glu Thr Thr Trp Glu Tyr Leu Leu Gly Gin 
85 90 95 

cag age atg atg gee gee ctg tgc ttc gec ccg ttc aac ggc gee gee 

Gin Ser Met Met Ala Ala Leu Cys Phe Ala Pro Phe Asn Gly Ala Ala 
100 105 110 



288 



336 



acg atg gac gag ate gtc gac ttc gee cgt ggc tgg egg ccc gac ctg 3 84 
Thr Met Asp Glu lie Val Asp Phe Ala Arg Gly Trp Arg Pro Asp Leu 
115 120 125 

gtc gtg tgg gaa ccc tgg acc tac gcg ggg ccg gtc gcg gec cgc gee 432 
Val Val Trp Glu Pro Trp Thr Tyr Ala Gly Pro Val Ala Ala Arg Ala 
130 135 140 

tgc ggt gec gee cac gcg cgc ate ctg tgg ggc ccc gac gec ate gga 480 
Cys Glv Ala Ala His Ala Arg lie Leu Trp Gly Pro Asp Ala He Gly 
145 150 155 160 

cgc tec cgc ctg cgc ttc etc gee gee etc gac ggg atg ccg gag gaa 52 8 
Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu 
165 170 175 

ctg cgc gag gac ccc ate gec gaa tgg etc ggc tgg acg ctg gac egg 57 6 
Leu Arg Glu Asp Pro He A_la Glu Trp Leu Gly Trp Thr Leu Asp Arg 
180 185 190 

tac ggg etc gec ttc gac gaa cgc gac gtg etc ggc cac tgg gtg ate 62 4 
Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val He 
195 200 205 

gac ccg ggc ccg cgc age acc cgc etc gac ctg ggc cag acc acg gtg 672 
Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gin Thr Thr Val 
210 215 220 

ccc atg tgc tac gtg ccc tac aac ggg cgc tec gtg ate gaa ccc tgg 72 0 
Px"o Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val He Glu Pro Trp 
225 ' 230 235 240 

etc ggc aag aag ccc gac cgc ccc cgc gtc tgc etc acc etc ggc gtg 768 
Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val 
245 250 255 

tec gee cgc gag acc tac ggc cgc gac gcg gtc tec tac tec gaa ctg 816 
Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu 
260 265 270 

ctg gag gcg etc ggc egg ctg gac ate gag gtg gtg gee acc ctg gac 864 
Leu Glu Ala Leu Gly Arg Leu Asp He Glu Val Val Ala Thr Leu Asp 
275 280 285 

acc tec cag etc gac cgc ctg ggc acc etc ccc gac aac gtc gtg ccc 912 
Thr Ser Gin Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro 
290 295 300 

gtg gac ttc gta ccg etc gac gcg ctg ctg ccg age tgc gee gcg ate 960 
Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala He 
305 310 315 320 



1er depot 



20 



ate cac cac ggc gga gcg ggc acc tgg tec ace gee ctg cgc cac gga 
lie His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Lieu Arg His Gly 

_ to: 



325 330 335 



ccc acg ate agg gcg ggc gcg egg egg ctg age gag gag atg etc gee 
Pro Ala lie Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala 
385 ~ ~ 390 395 400 

gac ccc acg ccc gee ggg ate ate ccc acc ctg gag cgc etc acc gee 
£sp Pro Thr Pro Ala Gly He He Pro Thr Leu Glu Arg Leu Thr Ala 
405 410 415 

ctg cac egg gee acc tga 
Leu His Arg Ala Thr 
420 



1008 



1056 



1104 



gtg ccg cag ate ctg ctg ccc tec ctg tgg gac gcg ccg etc aag gcg 
Val Pro Gin He Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala 
340 345 350 

cag caa etc cag cgc ctg tee gee ggg ttc gac ctg ccc gcg gcg acg 
Gin Gin Leu Gin Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr 
355 360 365 

etc acg gcg cgc ggt ctg gee gac gcg gtg cac acg gee gtg cac gac 1152 
Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp 
370 375 380 



1200 



1248 



1266 



<210> 8 
<211> 421 
<212> PRT 

<213> Streptomyees ambofaciens 



<400> 8 

Val Arg Val Leu 
1 

Leu Val Pro Leu 
20 

Val Ala Ser Pro 
35 

Thr Ala Val Pro 
50 

Glu Met Gly Ser 
65 

Glu Val Glu Ser 



Gin Ser Met Met 
100 

Thr Met Asp Glu 
115 

Val Val Trp Glu 
130 



Leu Thr Ser Leu 
5 

Ala Trp Ala Leu 



Pro Ser Leu Thr 
40 

Val Gly Asp Asp 
55 

Asp Leu Val Pro 
70 

Glu Glu Glu Thr 
85 

Ala Ala Leu Cys 



He Val Aso Phe 
120 

Pro Trp Thr Tyr 
135 



Ala His Asn Thr 
10 

Arg Ala Ala Gly 
25 

Asp Val He Thr 



Arg Pro Ala Ala 
60 



Tyr Gin Arg Gly 
75 

Thr Trp Glu Tyr 
90 

Phe Ala Pro Phe 
105 

Ala Arg Gly Trp 



Ala Gly Pro Val 
140 



His Tyr Tyr Ser 
15 

His Glu Val Arg 
30 

Ser Thr Gly Leu 
45 

Glu Leu Leu Ala 



Phe Glu Phe Gly 
80 

Leu Leu Gly Gin 
95 

Asn Gly Ala Ala 
110 

Arg Pro Asp Leu 
125 

Ala Ala Arg Ala 
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Cys Gly Ala Ala His Ala Arg lie Leu Trp Gly Pro Asp Ala He Gly 
145 150 155 160 

Arg Ser Arg Leu Arg Phe Leu Ala Ala Leu Asp Gly Met Pro Glu Glu 
165 170 175 

Leu Arg Glu Asp Pro He Ala Glu Trp Leu Gly Trp Thr Leu Asp Arg 
180 185 190 

Tyr Gly Leu Ala Phe Asp Glu Arg Asp Val Leu Gly His Trp Val lie 
195 200 205 

Asp Pro Gly Pro Arg Ser Thr Arg Leu Asp Leu Gly Gin Thr Thr Val 
210 215 220 

Pro Met Cys Tyr Val Pro Tyr Asn Gly Arg Ser Val He Glu Pro Trp 
225 " 230 235 240 

Leu Gly Lys Lys Pro Asp Arg Pro Arg Val Cys Leu Thr Leu Gly Val 
245 250 255 

Ser Ala Arg Glu Thr Tyr Gly Arg Asp Ala Val Ser Tyr Ser Glu Leu 
2 60 2 65 27 0 

Leu Glu Ala Leu Gly Arg Leu Asp He Glu Val Val Ala Thr Leu Asp 
275 280 285 

Thr Ser Gin Leu Asp Arg Leu Gly Thr Leu Pro Asp Asn Val Val Pro 
290 295 300 

Val Asp Phe Val Pro Leu Asp Ala Leu Leu Pro Ser Cys Ala Ala He 
305 310 315 320 

He His His Gly Gly Ala Gly Thr Trp Ser Thr Ala Leu Arg His Gly 
325 330 335 

Val Pro Gin He Leu Leu Pro Ser Leu Trp Asp Ala Pro Leu Lys Ala 
340 345 350 

Gin Gin Leu Gin Arg Leu Ser Ala Gly Phe Asp Leu Pro Ala Ala Thr 
355 360 365 

Leu Thr Ala Arg Gly Leu Ala Asp Ala Val His Thr Ala Val His Asp 
370 375 380 

Pro Ala He Arg Ala Gly Ala Arg Arg Leu Ser Glu Glu Met Leu Ala 
385 390 395 400 

Asp Pro Thr Pro Ala Gly He He Pro Thr Leu Glu Arg Leu Thr Ala 
405 410 415 

Leu His Arg Ala Thr 
420 



<210> 9 

<211> 1350 

<212> ADN 

<213> Streptomyces a^ribofaciens 
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<220> 

<221> CDS 

<222> (1) . . (1350) 



<400> 9 

atg ccc gaa age cat gcg cag age gcg ctg etc gec gcg ate ace gee 

Met P-r-o Glu Se^ His Ala Gin Ser Ala Leu Leu Ala Ala He Tnr Ala 

• i 5 10 15 

gca gac cgc acc ccc gag gac ate gcg gcg ctg ccc ctg ccc gag tec 

Ala Asp Arg Thr Pro Glu Aso He Ala Ala Leu Pro Leu Pro Glu Ser 

20 25 30 

ttc cgc gee gtg acc gtc cgc aaa gag gac acc gac atg ttc cgc ggg 

?he Arg Ala Val Thr Val A^rg Lys Glu Asp Thr Asp Met Phe Arg Gly 

35 40 45 

atg ccg age gcg gac aag gac ccg cgc aag tec ctg cac gtc gac gag 

Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu 

50 55 60 

gtg ccg ctg ccc gaa gtg ggg ccc ggg gag gcg ctg gtc gcg gtg atg 

Val "Pt-c. Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met 

65 70 75 80 



gec gcg cgc cac gac ctg ccg tac cac ate etc ggt tec gac ctg tec 

Ala Ala Arg His Asp Leu Pro Tyr His lie Leu Gly Ser Asp Leu Ser 

115 120 125 

ggc gtg gtg ctg cgc acg gga ccc ggc gtg aac gtc tgg aaa ccc ggt 

Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly 
130 135 140 

gac gag gtc gtc gcg cac tgt ctg teg gtg gag ctg gag age ccc gac 

Asp Glu Val Val Ala His Cys Leu Ser Val Glu Leu Glu Ser Pro Asp 

145 150 155 160 

ggg cac gac gac acc atg etc gac ccg gec cag cgc ate tgg ggc ttc 

Gly His Asp Asp Thr Met Leu Asp Pro Ala Gin Arg lie Trp Gly Phe 

165 170 175 



cag ctg atg ccc aag gcg gee cat ctg acc tgg gag gag gee gee gcg 
Gin Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala 
195 200 205 



48 



96 



144 



192 



240 



gec age tec gtc aac tac aac acg gtc tgg tec tec ate ttc gag ccc 288 

Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser lie Phe Glu Pro 
85 90 95 

etc ccg acg ttc ggc ttc ctg gag cgc tac ggg cgc acc teg ccg ctg 336 

Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu 
100 105 110 



384 



432 



480 



528 



gag acc aac ttc ggg ggc ctg gee gag gtg gee etc gtc aag tec aac 57 6 
Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn 
180 185 190 



624 



ccc ggt ctg gtc aac tec acc gec tac cgc cag ctg gtc tec cgc aac 672 
Pro Glv Leu Val Asn Ser Thr Ala Tyr Arg Gin Leu Val Ser Arg Asn 
210 215 220 
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ggc gcc ggc atg aag cag ggc gac aac gtg ctg ate tgg ggc gec age 720 
Gly Ala Gly Met Lys Gin Gly Asp Asn Val Leu lie Trp Gly Ala Ser 
225 230 235 240 

ggc ggc ctg ggc teg tac gcc acc cag ctg gcc etc gcc ggc ggg gcc 768 
Gly Gly Leu Gly Ser Tyr Ala Thr Gin Leu Ala Leu Ala Gly Gly Ala 
245 250 255 

cac ccc gtc tgc gtg gtc tec age gcg cgc aag gcc gag gtg tgc egg 816 
Kis Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu . Val Gys Arg 
260 265 270 

gcc atg ggc gcg gag gcc ate ate gac cgc tec gcc gag gac tac cgc 864 
Ala Met Gly Ala Glu Ala lie lie Asp Arg Ser Ala Glu Asp Tyr Arg 
275 280 285 

ttc tgg age gac gag gac acc cag gac ccg egg gag tgg aag cgc ttc 312 
Phe Trp Ser Asp Glu Asp Thr Gin Asp Pro Arg Glu Trp Lys Arg Phe 
290 295 300 

ggc aag cgc ate cgc gag gtc acc ggg ggc gag gac gtc gac ate gtc 960 
Gly Lys Arg lie Arg Glu Val Thr Gly Gly Glu Asp Val Asp lie Val 
305 310 315 320 

ttc gag cac ccc ggc egg gag acc ttc ggg gcg tec gtc tac gtc acc 1008 
Phe Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr 
325 330 335 

cgc agg ggc ggc acg ate gtc acc tgc gcc tec acc teg ggc ttc cgc 1056 
Arg Arg Gly Gly Thr lie Val Thr Cys Ala Ser Thr Ser Gly Phe Arg 
340 345 350 

cac gag ttc gac aac cgc tac etc tgg atg cac etc aag cgt ate gtc 1104 
Kis Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg lie Val 
355 360 365 

ggc acc cac ttc gcc aac tac cgc gag gcg tgg gag gcg aac egg etc 1152 
Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arg Leu 
370 375 380 

gtc gcc aag ggg agg ate cac ccc acc etc teg cgc acc tac ccg ctg 1200 
Val Ala Lys Gly Arg lie His Pro Thr Leu Ser Arg Thr Tyr Pro Leu 
385 390 395 400 

gcc gac acg gcg gtt gcc gtg cac gac gtg cac ggc aac cag cac cag 1248 
Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gin His Gin 
405 410 415 

ggc aag gtc ggc gtg etc tgc ctg gcg ccc acg gag ggg ctg ggc gtg 12 9 6 
Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val 
420 425 430 

cgc gac gag gag aag egg gcg egg cac ate gac gcg ate aac egg ttc 13 44 
Arg Asp Glu Glu Lys Arg Ala Arg His lie Asp Ala lie Asn Arg Phe 
435 440 445 

cgc tga 1350 
Arg 

450 
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<210> 10 
<211> 449 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 10 

Met Pro Glu Ser His Ala Gin Ser Ala Leu Leu Ala Ala He Thr Ala 
1 5 1.0 15 

Ala Asp Arg Thr Pro Glu Asp He Ala Ala Leu Pro Leu Pro Glu Ser 
20 25 30 

Phe Arg Ala Val Thr Val Arg Lys Glu Asp Thr Asp Met Phe Arg Gly 
35 40 45 

Met Pro Ser Ala Asp Lys Asp Pro Arg Lys Ser Leu His Val Asp Glu 
50 55 60 

Val P^o Leu Pro Glu Val Gly Pro Gly Glu Ala Leu Val Ala Val Met 
65 70 75 80 

Ala Ser Ser Val Asn Tyr Asn Thr Val Trp Ser Ser He Phe Glu Pro 
85 90 95 

Leu Pro Thr Phe Gly Phe Leu Glu Arg Tyr Gly Arg Thr Ser Pro Leu 
100 105 HO 

Ala Ala Arg Kis Asp Leu Pro Tyr His He Leu Gly Ser Asp Leu Ser 
115 120 125 

Gly Val Val Leu Arg Thr Gly Pro Gly Val Asn Val Trp Lys Pro Gly 
130 135 140 

Asp Glu Val Val Ala Kis Cys Leu Ser Val Glu Leu Glu Ser Pro Asp 
145 150 155 160 

Gly His Asp Ast) Thr Met Leu Asp Pro Ala Gin Arg He Trp Gly Phe 
165 170 175 

Glu Thr Asn Phe Gly Gly Leu Ala Glu Val Ala Leu Val Lys Ser Asn 
180 185 190 

Gin Leu Met Pro Lys Ala Ala His Leu Thr Trp Glu Glu Ala Ala Ala 
195 200 205 

Pro Gly Leu Val Asn Ser Thr Ala Tyr Arg Gin Leu Val Ser Arg Asn 
210 215 220 

Gly Ala Gly Met Lys Gin Gly Asr> Asn Val Leu He Trp Gly Ala Ser 
225 230 235 240 

Gly Gly Leu Gly Ser Tyr Ala Thr Gin Leu Ala Leu Ala Gly. Gly Ala 
- - 245 250 255 

His Pro Val Cys Val Val Ser Ser Ala Arg Lys Ala Glu Val Cys Arg 
260 265 270 

Ala Met Gly Ala Glu Ala lie lie Asp Arg Ser Ala Glu Asp Tyr Arg 
275 280 285 
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Phe Trp Ser Asp Glu Asp Thr Gin Asp Pro Arg Glu Txo Lvs Arg Phe 
290 295 300 

Gly Lys Arg He Arg Glu Val Thr Gly Gly Glu Asp Val Aso He Val 
305 310 315 320 

Phe. Glu His Pro Gly Arg Glu Thr Phe Gly Ala Ser Val Tyr Val Thr 
325 330 335 

A-rg--A-rg-Gly-Gly-Thr-a -Gly Ph-e"Arg — 

340 345 350 

Kis Glu Phe Asp Asn Arg Tyr Leu Trp Met His Leu Lys Arg He Val 
355 360 365 

Gly Thr His Phe Ala Asn Tyr Arg Glu Ala Trp Glu Ala Asn Arc Leu 
370 375 380 

Val Ala Lys Gly Arg He His Pro Thr Leu Ser Arg Thr Tyr Pro Leu 
385 390 395 400 

Ala Asp Thr Ala Val Ala Val His Asp Val His Gly Asn Gin His Gin 
405 , _ 410 415 

Gly Lys Val Gly Val Leu Cys Leu Ala Pro Thr Glu Gly Leu Gly Val 
42 0 42 5 " 430 

Arg Asp Glu Glu Lys Arg Ala Arg His He Asp Ala He Asn Arc Phe 
435 440 445 

Arg 



<210> 11 
<2il> 675 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (675) 

<400> 11 

atg atg age gtg gca gac cag acg get etc age ccc gcg ctg ctg gag 48 

Met Met Ser Val Ala Asp Gin Thr Ala Leu Ser Pro Ala Leu Leu Glu 

1 5 10 15 

tac gec egg age gtc gcg ctg egg gac gac ggc ctg ctg cgc gaa ctg 96 
Tyr Ala Arg Ser Val Ala Leu Arg Asp Asd Gly Leu Leu Arg Glu Leu 
20 25 30 

cac gag gtg acc gec ggg etc ccc ggc ggc egg gec atg cag ate atg 144 
His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gin He Met 
35 40 45 

ccc gag gag gcg cag ttc etc gec ctg ctg ate egg etc gtc ggt gee 192 
Pro Glu Glu Ala Gin Phe Leu Ala Leu Leu He Arg Leu Val Gly Ala 
30 55 60 

egg egg gtg ctg gag ate ggc acc ttc acg ggg tac age acg ctg tgc 2 40 



1er depot 



26 



&rg Arg Val Leu Glu lie Gly Thr ?he Thr Gly Tyr Ser Thr Leu Cys 
65 ~ 70 75 80 

atg gcg egg gca ctg ccc gec gac ggc acc gtc gtc acc tgc gac ate 
Met Ala Arg Ala Leu Pro Ala Aso Gly Thr Val Val Thr Cys Asp lie 
85 90 95 

age gac agg tgg ccc ggc gtc ggc gca ccg tac tgg cgc egg gec ggg 
Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly 
100 105 HO 

gtg gag tec egg ate gac ctg cgc gtc ggc gac gec gtc egg acc etc 
Val Glu Ser Arg lie Asd Leu Arg Val Gly Asp Ala Val Arg Thr Leu 
115 120 125 



ate gac gee gac aag acc ggg tac ccg cac tac tac gag cag gcg ctg 

Val Asp Ala Asp Lys Thr Glv Tyr Pro His Tyr Tyr Glu Gin Ala Leu 

145 150 155 160 

gee ctg gta cgc ccc ggc gga ctg gtg gcg gtc gac aac acc ctg ttc 

Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe 

165 170 175 



tga 
225 



288 



336 



384 



gee aaa etc cgc gag cac gag ggg gac ggc teg ttc gac ctg gtc ttc 432 
Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe 
130 135 140 



480 



528 



ttc ggc egg gtg gec gac ccg gee gtc gag gac gee gac acc gtc gec 57 6 

Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala 
180- 185 130 

gtg cgc gcg etc aac gag ctg ctg cgc gac gac gaa cgc gtg gac ate 624 

Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp He 

195 200 205 

gec ctg ctg acg gtc gee gac ggg ate act ctg gee cgc egg egg gag 672 

Ala Leu Leu Thr Val Ala Asp Gly lie Thr Leu Ala Arg Arg Arg Glu 

210 215 220 



675 



<210> 12 
<211> 224 
<212> PRT 

<213> Streptomyces arnbofaciens 
<400> 12 

Met Met Ser Val Ala Asp Gin Thr Ala Leu Ser Pro Ala Leu Leu Glu 
15 10 15 

Tyr Ala Arg Ser Val Ala Leu Arg Asp Asp Gly Leu Leu Arg Glu Leu 
2 0 25 30 

His Glu Val Thr Ala Gly Leu Pro Gly Gly Arg Ala Met Gin lie Met 
35 40 45 

Pro Glu Glu Ala Gin Phe Leu Ala Leu Leu lie Arg Leu Val Gly Ala 
50 55 60 
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Arg Arg Val Leu Glu lie Gly Thr Phe Thr Giy Tyr Ser Thr Leu Cys 

65 70 75 80 

Met Ala Arg Ala Leu Pro Ala Asp Gly Thr Val Val Thr Cys Asp lie 

85 90 95 

Ser Asp Arg Trp Pro Gly Val Gly Ala Pro Tyr Trp Arg Arg Ala Gly 

100 105 110 



Val Glu Ser Arg lie .Asp Leu Arg Val Gly Asp Ala Val Arg Thr Leu - 
115 120 125 

Ala Glu Leu Arg Glu His Glu Gly Asp Gly Ser Phe Asp Leu Val Phe 
130 135 140 

Val Asp Ala Asp Lys Thr Gly Tyr Pro His Tyr Tyr Glu Gin Ala Leu 
145 150 155 160 

Ala Leu Val Arg Pro Gly Gly Leu Val Ala Val Asp Asn Thr Leu Phe 
165 170 175 

Phe Gly Arg Val Ala Asp Pro Ala Val Glu Asp Ala Asp Thr Val Ala 
180 185 190 

Val Arg Ala Leu Asn Glu Leu Leu Arg Asp Asp Glu Arg Val Asp lie 
195 200 205 

Ala Leu Leu Thr Val Ala Asp Gly lie Thr Leu Ala Arg Arg Arg Glu 
210 215 220 



<210> 13 
<211> 1245 
<212> ADN 

<213> Strep tomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1245) 

<400> 13 

gtg etc cag cgc gtc gat ctg teg tea 
Val Leu Gin Arg Val Asp Leu Ser Ser 
1 5 

gcg gcg ctg acg gta ttc gec tgt cac 
.Ala Ala Leu Thr Val Phe Ala Cys Mis 
20 25 

gec gac cag cag gtg ggc age gca ctg 
Ala Asp Gin Gin Val Gly Ser Ala Leu 
35 40 

tec atg gcg gtc teg ate ttc ttc ata 
Ser Met Ala Val Ser lie Phe Phe lie 
50 55 

tgg teg gec cgc gac gag gac tec gtg 
Trp Ser Ala Arg Asp Glu Asp Ser Val 



etc acc ggc etc cgc tgg tat 4 8 
Leu Thr Gly Leu Arg Trp Tyr 
10 15 

ate gec cag cag ggc ttc ttc 96 
lie Ala Gin Gin Gly Phe Phe 
30 

ctg cac ate acc ccg etc ggt 144 
Leu His lie Thr Pro Leu Gly 
45 

ctg agt gga ttc gtc etc gec 192 
Leu Ser Gly Phe Val Leu Ala 
60 

ccg act ttc tgg egg cgc cgc 240 
Pro Thr Phe Trp Arg Arg Arg 
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65 70 75 BO 

ate gcg aag ate tat ccg ctg cat etc gcg acg ttc ggc ate gcg get 
x?e III Lys He Tyr Pro Leu His Leu Ala Thr Phe Gly He Ala Ala 
85 90 95 

etc ate att tte tee ctg teg gag eeg gta etc ccc ggc ggt tec gta 
Leu lie He Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val 
100 105 1x0 

tgg gac ggg ctg gtg ccc aat gtt ctg etc gtg cag tec tgg ctt ccc 
Asp Gly Leu Val Pro Asn Val Leu Leu Val Gin Ser Trp Leu Pro 
115 120 I 25 

gac gcg ace etc acg gee agt ttc aac acg ccc age tgg teg etc tec 
Aso Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser 
" 130 135 1^0 

tgt gag ate gee ttc tat ctg teg ttc ccg ctg tgg tac egg ctg gtg 
Cvs Glu He Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val 
145 150 155 160 

cgc agg att ccc gca egg egg ctg tgg tgg tgc gee gcg ggg ate gee 
Arg Arg He Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly He Ala 
165 170 175 

gta gee gtg acg tgt gtg ccc ctg ctg gcg ggc ctg etc ccg gcg age 
Val Ala Vat Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser 
180 185 190 

gag gag gtg gee ccc ggg atg teg etc aac gag gtc tgg ttc gcg tac 
Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp Phe Ala Tyr 
195 200 205 

tgg ctt ccg ccg gtg cgc atg ctg gag ttc gtc etc ggc ate gtg atg 
Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly He Val Met 
210 215 220 

gcg ctg ate ctg cgc gcg ggg ate tgg aag ggc ccc ggt ccg gcg gtc 
Ala Leu He Leu Arg Ala Gly He Trp Lys Gly Pro Gly Pro Ala Val 
225 230 235 240 

tgc acg gcg etc etc gee gcg agt tac ggc etc ace cag atg gtg ccc 
Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gin Met Val Pro 
245 250 255 

ccg ate ttc acc etc gtc gee tgc tec gtc gta ccg gee gcg ctg ctg 
Pro He Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu 
260 265 270 

ate acg gcg ctg gee gac gee gac gtg cac ggc egg cgc acg ggg ctg 
lie Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu 
275 280 • 285 

cgt teg gcg acg ctg gtg egg ctg ggc cag tgg tec ttc gec ttc tac 
Arg Ser Ala Thr Leu Val Arg Leu Gly Gin Trp Ser Phe Ala Phe Tyr 
290 295 300 

ctg gtc cac ttc ctg ate ate cgc tac gga cac egg ctg atg ggc ggc 
Leu Val His »he Leu He He Arg Tvr Gly His Arg Leu Met Gly Gly 
305 310 315 320 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 
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gat ctg ggc tac gag egg cag tgg age acc ccg gec gcg ate gcg ctg 1008 
Asp Leu Gly Tyr Glu Arg Gin Trp Ssr Thr Pro Ala Ala lie Ala Leu 
325 33 0 33 5 

tec ctg ggg atg ctg ggg gtg gcg gtc ctg gee ggc ggt ctg ctg cac 1056 
Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His 
340 345 350 

"acc" ~gtc"gtc^gaa~ca~a^ 1-1-04 
Thx Val Val Glu Gin Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser . 
355 360 365 

gec tec cgt ccg aag ccc ggc gec acc gcg get ccc egg aac tea ccc 1152 
Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro 
370 375 380 

gcg gee gac gcg gee ggc gtg ccc ctg etc ccg ggc gta ccc ggg ccc 1200 
Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro 
385 390 395 400 

gcg cac acc ccc gca gcg acg aac gaa ccc acc ccg aga gga tga 1245 
Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly 

405 410 ' ' 415 



<210> 14 

<211> 414 

<212> PRT 

<213> Streptomyces ambofaciens 

<400> 14 

Val Leu Gin Arg Val Asp Leu Ser Ser Leu Thr Gly Leu Arg Trp Tyr 
1 5 10 15 

Ala Ala Leu Thr Val Phe Ala Cys His lie Ala Gin Gin Gly Phe Phe 
20 25 30 

Ala Asp Gin Gin Val Gly Ser Ala Leu Leu His lie Thr Pro Leu Gly 
35 40 45 

Ser Met Ala Val Ser lie Phe Phe lie Leu Ser Gly Phe Val Leu Ala 
50 55 60 

Trp Ser Ala Arg Asp Glu Asp Ser Val Pro Thr Phe Trp Arg Arg Arg 
65 70 75 80 

lie Ala Lys lie Tyr Pro Leu His Leu Ala Thr Phe Gly lie Ala Ala 
85 90 95 

Leu He lie Phe Ser Leu Ser Glu Pro Val Leu Pro Gly Gly Ser Val 
100 105 110 

Trp Asp Gly Leu Val Pro Asn Val Leu Leu Val Gin Ser Trp Leu Pro 
115 120 125 

Asp Ala Thr Leu Thr Ala Ser Phe Asn Thr Pro Ser Trp Ser Leu Ser 
130 135 140 

Cys Glu He Ala Phe Tyr Leu Ser Phe Pro Leu Trp Tyr Arg Leu Val 
145 150 155 160 
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Arg Arg lie Pro Ala Arg Arg Leu Trp Trp Cys Ala Ala Gly xle Ala 
165 170 175 

Val Ala Val Thr Cys Val Pro Leu Leu Ala Gly Leu Leu Pro Ala Ser 
180 185 190 

Glu Glu Val Ala Pro Gly Met Ser Leu Asn Glu Val Trp ?he Ala Tyr 
195 200 205 

Trp Leu Pro Pro Val Arg Met Leu Glu Phe Val Leu Gly He Val Met 
210 215 220 

Ma Leu He Leu Arg Ala Gly He Trp Lys Gly Pro Gly Pro Ala Val 
225 230 235 240 

Cys Thr Ala Leu Leu Ala Ala Ser Tyr Gly Leu Thr Gin Met Val Pro 
245 250 • 255 

Pro He Phe Thr Leu Val Ala Cys Ser Val Val Pro Ala Ala Leu Leu 
260 265 270 

He Thr Ala Leu Ala Asp Ala Asp Val His Gly Arg Arg Thr Gly Leu 
275 280 285 

Arg Ser Ala Thr Leu Val Arg Leu Gly Gin Trp Ser Phe Ala Phe Tyr 
290 295 300 

Leu Val His Phe Leu He He Arg Tyr Gly His Arg Leu Met Gly Gly 
305 310 315 320 

Asp Leu Gly Tyr Glu Arg Gin Trp Ser Thr Pro Ala Ala He Ala Leu 
325 330 335 

Ser Leu Gly Met Leu Gly Val Ala Val Leu Ala Gly Gly Leu Leu His 
340 345 350 

Thr Val Val Glu Gin Pro Cys Met Arg Leu Phe Gly Ser Arg Arg Ser 
355 360 365 

Ala Ser Arg Pro Lys Pro Gly Ala Thr Ala Ala Pro Arg Asn Ser Pro 
370 375 380 

Ala Ala Asp Ala Ala Gly Val Pro Leu Leu Pro Gly Val Pro Gly Pro 
385 * 390 395 400 

Ala His Thr Pro Ala Ala Thr Asn Glu Pro Thr Pro Arg Gly 
405 410 



<210> 15 
<211> 849 
<212> ADN 

<2 13 > Strep tomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (849) 



<400> -15 
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gtg aca ttg aaa tec cca ctg cca ccg caa tec gtc tec gca ccc get 48 
Val Thr Leu Lys Ser Pro Leu Pro Pro Gin Ser Val Ser Ala Pro Ala 
15 10 15 

gat tea cgc age ace geg egg aga gaa tgg ggt cag aac ttc ttt cgt 9 6 
Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gin Asn Phe Phe Arg 
20 25 30 

aca gee gec gcg gee tgt cgt ttc tec get cag ctg gac ggt teg gac 144 
Thr Ala -Ala Ala~ Ala Cys Arg Phe -Ser- Ala Gin -Leu -Asp Gly Ser Asp 
35 40 45 

ace att ccg ccc gat tct ccg aat gac ctg atg acc gtc gaa ata ggc 192 
Thr lie Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu lie Gly 
50 55 60 

gcg gga tea ggg egg gtg acc aaa gtg etc gee tea ccc ggg acg cct 240 
Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro 
65 70 75 80 

eta etc geg gtg gaa ata gat ccc cgc tgg get egg egg ctg gec gee 2 88 
Leu Leu Ala Val Glu lie Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala 
85 90 95 

gaa teg ctg ccg gac gtc acg gtg gtg aac gag gat ttc ctg acc ctg 336 
Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu 
100 105 110 

caa ctg ccc ggg cag ccg gtc aga etc ate ggg aat ctt ccc ttc gtc 3 84 
Gin Leu Pro Gly Gin Pro Val Arg Leu lie Gly Asn Leu Pro Phe Val 
115 120 125 

acc ggc ace aga atg ctg agg cgc tgc etc gac atg ggt ccg gcg cgc 432 
Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg 
130 135 140 

atg egg cag ggc gtg ttc ctg ttg cag egg gag tac gtg gga aag egg 4 80 
Met Arg Gin Gly Val Phe Leu Leu Gin Arg Glu Tyr Val Gly Lys Arg 
145 150 155 160 

acc gga gec tgg ggc gga aac etc ttc aac gec cag tgg gag ccg tgg 528 
Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gin Trp Glu Pro Trp 
165 170 175 

tac teg ttc gac egg ggc ctg gee ttc tea cgc cag gac ttc acc ccc 576 
Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gin Asp Phe Thr Pro 
180 185 190 

gta ccg cgc gcg gac acc cag acc ctg atg gtc gee ccg cac cgc agg 624 
Val Pro Arg Ala Asp Thr Gin Thr Leu Met Val Ala Pro His Arg Arg 
195 200 205 

ccg tec gtg ccc tgg cgt gag aag gee gee tac cag egg ttc gtc caa 672 
Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gin Arg Phe Val Gin 
210 215 220 

egg gtc ttc gac acc ggc cag atg acg gtg ggc gac gee gcg egg aag 72 0 
Arg Val Phe Asp Thr Gly Gin Met Thr Val Gly Asp Ala Ala Arg Lys 
225 230 235 240 



gtg ctg cgc cgc gga cac gee cag ttc gtg cgc ggg gcg ggc gtg agg 



768 
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Val Leu Arg Arg Gly Kis Ala Gin 
245 

ccg gcc gac egg gtc aag gac etc 
Pro Ala Asp Arg Val Lys Asp Leu 
260 

ttc cgc gcc tac ggg egg acg gcc 
Phe Arg Ala Tyr Gly Arg Thr Ala 
275 280 



Phe Val Arg Gly Ala Gly Val Arg 
250 255 

acg gtc ccg gag tgg acc gca etc 816 
Thr Val Pro Glu Trp Thr Ala Leu 
265 270 

gac cgc tga 849 
Asp Arg 



<210> 16 
<211> 282 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 16 

Val Thr Leu Lys Ser Pro Leu Pro Pro Gin Ser Val Ser Ala Pro Ala 
1 " 5 10 15 

Asp Ser Arg Ser Thr Ala Arg Arg Glu Trp Gly Gin Asn Phe Phe Arg 
20 25 30 

Thr Ala Ala Ala Ala Cys Arg Phe Ser Ala Gin Leu Asp Gly Ser Asp 
35 40 45 

Thr lie Pro Pro Asp Ser Pro Asn Asp Leu Met Thr Val Glu lie Gly 
50 . 55 60 

Ala Gly Ser Gly Arg Val Thr Lys Val Leu Ala Ser Pro Gly Thr Pro 
65 70 75 80 

Leu Leu Ala Val Glu lie Asp Pro Arg Trp Ala Arg Arg Leu Ala Ala 
85 90 95 

Glu Ser Leu Pro Asp Val Thr Val Val Asn Glu Asp Phe Leu Thr Leu 
100 105 110 

Gin Leu Pro Gly Gin Pro Val Arg Leu He Gly Asn Leu Pro Phe Val 
115 120 125 

Thr Gly Thr Arg Met Leu Arg Arg Cys Leu Asp Met Gly Pro Ala Arg 
130 135 140 

Met Arg Gin Gly Val Phe Leu Leu Gin Arg Glu Tyr Val Gly Lys Arg 
145 150 155 160 

Thr Gly Ala Trp Gly Gly Asn Leu Phe Asn Ala Gin Trp Glu Pro Trp 
165 170 175 

Tyr Ser Phe Asp Arg Gly Leu Ala Phe Ser Arg Gin Asp Phe Thr Pro 
180 185 190 

Val Pro Arg Ala Asp Thr Gin Thr Leu Met Val Ala Pro His Arg Arg 
195 200 205 

Pro Ser Val Pro Trp Arg Glu Lys Ala Ala Tyr Gin Arg Phe Val Gin 
210 215 220 



Arg Val Phe Asp Thr Gly Gin Met Thr Val Gly Asp Ala Ala Arg Lys 
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225 230 235 240 

Val Leu Arg Arg Gly His Ala Gin Phe Val Arg Gly Ala Gly Val Arg 

245 250 25^ 

Pro Ala Asp Arg Val Lys Asp Leu Thr Val Pro Glu Trp Thr Ala Leu 

260 265 270 

Phe Arg Ala Tyr Gly Arg Thr Ala Asp Arg 

• - -2 75 • 280 -- 



<210> 17 
<211> 831 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (831) 



<400> 17 

gtg aag gag gtg gcg gtc gac acc ggt acc ccg gcc ggc ccc gtg tag 

Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp 

15 10 15 

cgt ggt gcc ggc etc ggc acc cag ctg tgg gta ctg acc gcg egg cag 

Arg Gly Ala Gly Leu Gly Thr Gin Leu Trp Val Leu Thr Ala Arg Gin 

20 25 30 

ate cgt tec atg tac ggc gac cgc cgc ctg gcg ctg ttc age ctg atg 

lie Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met 

3 5 40 45 



48 



96 



144 



caa ccg gtg ate atg ctg ttg ctg ctg age gag ate ttc ggc age atg 192 

Gin Pro Val He Met Leu Leu Leu Leu Ser Glu He Phe Gly Ser Met 

50 55 60 

gcc gac ccg gac gac ttc ccg cag ggc gtg cgc tac ate gac tac gtg 240 

Ala Asp Pro Asp Asp Phe Pro Gin Gly Val Arg Tyr lie Asp Tyr Val 

65 70 75 80 

gtg ccc gcg ctg ctg gtc acc acc ggc ate ggc teg gcc cag ggc gcg 2 88 

Val Pro Ala Leu Leu Val Thr Thr Gly He Gly Ser Ala Gin Gly Ala 
85 90 95 

ggg gtg ggc ctg gtc agg gac atg gac aac ggg atg gtg gcg cgc ttc 33 6 

Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe 

100 105 110 

cgc gtc ctg ccg gcc egg ctg ttc ctg gtg ctg gtc gcc egg teg ctg 384 

Arg Val Leu Pro Ala Arg Leu Phe Leu Val Leu Val Ala Arg Ser Leu 

115 120 125 

gcc gat ctg gtc cgt gtg ttc acc gag ttg gtc gtc etc gtg gcc gtc 432 

Ala Asp Leu Val Arg Val Phe Thr Glu Leu Val Val Leu Val Ala Val 

130 135 140 



ggt gtg ate ctg ctg ggc ttc cgt ccg gcc ggg ggt ttg tgg ggc acg 
Gly Val He Leu Leu Gly Phe Arg Pro Ala Gly Gly Leu Trp Gly Thr 



480 
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145 150 155 160 

tec gec gec ctg ttg etc acc ctg etc gtc ate tgg teg ctg ate tgg 
Se^ Ala Ala Leu Leu Leu Thr Leu Phe Val He Trp Ser Leu He Trp 
165 170 175 

gag ttc ate gec etc gcg gcg tgg ctg cgc age gtg gag gtg atg tec 
GW ^he He Ala Leu Ala Ala Trp Leu Arg Ser Val Glu Val Met: Ser 
" 180 185 190 

age etc gcg gtt ctg gtg atg ttc ccg etc atg ttc gee tec agt gcg 
Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala 
195 200 205 

ttc gtc ccg ctg gac gec etc ccg gag tgg ctg cgc teg gtg gcg cac 
Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala Hrs 
210 215 220 

etc aac ccc gtg acg tac gcg gtc gac age gec cgc cgc ctg gcg ctg 
Leu Asn Pro Val Thr Tvr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu 
225 230 235 240 

gac tag gac ccg ggg tgg age gtg ccc ggc gcg ctg ctg acc age acc 
Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr 
245 250 255 

o-cg etc atg gcg gtg ggg atg tac gtc gee ggg cgt tec ttc aag agg 
Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg 
. . 260 265 270 

ccc ccg aac gaa tga 
Pro Pro Asn Glu 
275 



528 



576 



624 



672 



720 



768 



816 



831 



<210> 18 
<211> 276 
<212> PRT 

<213> Streptomyces ainbof aciens 
<400> 18 

Val Lys Glu Val Ala Val Asp Thr Gly Thr Pro Ala Gly Pro Val Trp 
15 10 15 

Arg Gly Ala Gly Leu Gly Thr Gin Leu Trp Val Leu Thr Ala Arg Gin 
20 25 V 30 

He Arg Ser Met Tyr Gly Asp Arg Arg Leu Ala Leu Phe Ser Leu Met 
3 5 4 0 45 

Gin Pro Val He Met Leu Leu Leu Leu Ser Glu He Phe Gly Ser Met 
50 55 60 

a la Asp Pro Asp Asp Phe Pro Gin Gly Val Arg Tyr He Asp Tyr Val 
65 ~ 70 75 80 

Val Pro Ala Leu Leu Val Thr Thr Gly He Gly Ser Ala Gin Gly Ala 
85 - 90 35 

Gly Val Gly Leu Val Arg Asp Met Asp Asn Gly Met Val Ala Arg Phe 
100 105 HO 
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Arg Val Leu Pro Ala Arg Leu Phe 
115 120 

Ala Asp Leu Val Arg Val Phe Thr 

130 135 

Gly Val lie Leu Leu Gly Phe Arg 
145 150 



Leu Val Leu Val Ala Arg Ser Leu 
125 

Glu Leu Val Val Leu Val Ala Val 
140 

Pro Ala Gly Gly Leu Trp Gly Thr 
155 160 



Ser Ala Ala Leu Leu Leu Thr Leu Phe Val -lie Trp Ser Leu, lie Trp 
165 170 175 

Gly Phe lie Ala Leu Ala Ala Trp Leu Arg Ser Val .Glu Val Met Ser 
180 185 190 

Ser Leu Ala Val Leu Val Met Phe Pro Leu Met Phe Ala Ser Ser Ala 
195 200 205 

Phe Val Pro Leu Asp Ala Leu Pro Glu Trp Leu Arg Ser Val Ala His 
210 215 220 

Leu Asn Pro Val Thr Tyr Ala Val Asp Ser Ala Arg Arg Leu Ala Leu 
225 230 235 240 

Asp Trp Asp Pro Gly Trp Ser Val Pro Gly Ala Leu Leu Thr Ser Thr 
245 250 255 

Ala Leu Met Ala Val Gly Met Tyr Val Ala Gly Arg Ser Phe Lys Arg 
260 265 270 

Pro Pro Asn Glu 
275 



<210> 19 
<211> 882 
<212> ADN 

<213 > Strep tomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (882) 

<400> 19 

gtg gac ate gag gtc gaa egg ggc egg gtg etc ggg ctg ctg ggt cac 48 
Val Asp lie Glu Val Glu A.rg Gly Arg Val Leu Gly Leu Leu Gly His 
15 10 15 

aac ggg gee ggc aag acg ace ttg gtg aac ate ctt gee acg gtc tec 96 
Asn Gly Ala Gly Lys Thr Thr Leu Val Asn He Leu Ala Thr Val Ser 
20 25 30 

cog gcg tec gcg ggc acg gtg acc gtc gec ggt ttc gac gtc gcg acg 144 
Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr 
35 40 45 

cag ggc gec gag ate cgc gcg cgc ate ggg gtg acc ggc cag ttc gcg 192 
Gin Gly Ala Glu He Arg Ala Arg He Gly Val Thr Gly Gin Phe Ala 
50 -55 60 
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384 



teg gtg gac gag tac ctg age gga ttc cgc aac etc gtc ctg ate ggc 240 
Ser Val Aso Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu lie Gly 
65 70 75 80 

cgc etc etc ggg gcg gga egg cgt gag gcg geg gee egg gee ace gag 2 88 
Arg Leu Leu Glv Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu 
85 90 95 

etc ctg gag ctg ttc gag ctg acc ggg gcg gee cac cag ccc tec cgc 33 6 
Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala Kis Gin Pro Ser Arg 
100 105 110 

acc tac teg ggc ggg atg cgc cga egg "etc gac etc gee gee age ctg 
Thr Tyr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu 
115 120 125 

gtc ggc cag ceg gac gtg ctg ttc etc gac gag ccg acg acc ggg ctg 
Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu 
130 135 140 

gac ccg gcg acc egg ate gee ctg tgg gag acg gtg gag aag ctg gtg 
Aso Pro Ala Thr Arg He Ala Leu Trp Glu Thr Val Glu Lys Leu Val 
145 150 155 160 

gcg ggc ggc acg acc gtc ctg ctg acc acc cag tac ctg gac gag gcg 
Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gin Tyr Leu Asp Glu Ala 
165 170 175 

gac egg ctg gee gac tgg ate acc gtc ctg teg aag ggc egg gtg gtg 
Asp Arg Leu Ala Asp Trp He Thr Val Leu Ser Lys Gly Arg Val Val 
180 185 190 

gee teg gac acc acc gac egg etc aag gee gac ctg ggc cac egg teg 
Ala Ser Aso Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser 
195 200 205 

gtg egg gtg gtc ctt ccg ccc gee gee gac ctg acg gee gee gee gee 
Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala 
210 215 220 

gcg etc acc gee ggc ggg ttc cgt ccg egg tec gac gee ggg gag cac 
Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His 
225 230 235 240 

gcg ctg acc acg ccc gtg gac acc teg gee ggt ate gcg ggc gtc ate 
Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly He Ala Gly Val He 
245 250 255 

cgc acg ctg gac acc gtc gga acg cag gee gtc gag ctg acc gtc aag 
Ara Ala Leu Asp Thr Val Gly Thr Gin Ala Val Glu Leu Thr Val Lys 
260 265 270 

gag ccg tec ctg gac gac gtc tac ctg gcg etc acc cat ccc tea ccc 
Glu Pro Ser Leu Aso Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro 
275 280 285 

gee gee gac gcg gec tga 
Ala Ala Asp Ala Ala 
290 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



882 
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<210> 20 
<211> 2S3 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 20 

Val Asp lie Glu Val Glu Arg Gly Arg Val Leu Gly Leu Leu Gly His 
1_ " _5_ 10_ 15 

Asn Glv Ala Gly Lys Thr Thr Leu Val Asn lie Leu Ala Thr Val Ser 
20 25 30 

Pro Ala Ser Ala Gly Thr Val Thr Val Ala Gly Phe Asp Val Ala Thr 
35 40 45 

Gin Gly Ala Glu He Arg Ala Arg He Gly Val Thr Gly Gin Phe Ala 
50 55 60 

Ser Val Asp Glu Tyr Leu Ser Gly Phe Arg Asn Leu Val Leu He Gly 
65 70 75 80 

Arc Leu Leu Gly Ala Gly Arg Arg Glu Ala Ala Ala Arg Ala Thr Glu 
85 ' 90 " 95 

Leu Leu Glu Leu Phe Glu Leu Thr Gly Ala Ala His Gin Pro Ser Arg 
100 105 110 

Thr Tvr Ser Gly Gly Met Arg Arg Arg Leu Asp Leu Ala Ala Ser Leu 
115 12 0 12 5 

Val Gly Arg Pro Asp Val Leu Phe Leu Asp Glu Pro Thr Thr Gly Leu 
130 135 140 

Asp Pro Ala Thr Arg He Ala Leu Trp Glu Thr Val Glu Lys Leu Val 
145 150 155 160 

Ala Gly Gly Thr Thr Val Leu Leu Thr Thr Gin Tyr Leu Asp Glu Ala 
165 170 175 

Asp Arg Leu Ala Asp Trp He Thr Val Leu Ser Lys Gly Arg Val Val 
180 185 190 

Ala Ser Asp Thr Thr Asp Arg Leu Lys Ala Asp Leu Gly His Arg Ser 
195 200 205 

Val Arg Val Val Leu Pro Pro Ala Ala Asp Leu Thr Ala Ala Ala Ala 
210 , 215 220 

Ala Leu Thr Ala Gly Gly Phe Arg Pro Arg Ser Asp Ala Gly Glu His 
225 230 235 240 

Ala Leu Thr Thr Pro Val Asp Thr Ser Ala Gly He Ala Gly Val He 
245 250 255 

Arg Ala Leu Asp Thr Val Gly Thr Gin Ala Val Glu Leu Thr Val Lys 
260 265 270 



Glu Pro Ser Leu Asp ' Asp Val Tyr Leu Ala Leu Thr His Pro Ser Pro 
275 280 285 
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Ala Ala Asp Ala Ala 
290 



<210> 21 
<211> 228 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . - (228) 



96 



144 



192 



228 



atg age aac ccg ttc gag gac acg gaa gec acc tac gtc gtg ctg g.c 48 
Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val 
1 5 10 15 

aac gac gag ggg cag cac teg ctg tgg ccg teg ttc gcg gag gtc ccg 
Asn Asp Glu Gly Gin His Ser Leu Trp Pro Ser Pne Ala Glu Val Pro 
20 25 30 

gcg ggc tag tec gtc gtg gtg ccg gag acg gac egg cag teg tgc ctg 
Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gin Ser Cys Leu 
35 40 45 

gac tac ate aac gag aac tgg acc gac atg cgc ccc aag age etc gtc 
Asp Tyr He Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val 
50 55 60 

gag gcg atg gcg acg gee ggg cag gac gee cct tga 
Glu Ala Met Ala Thr Ala Gly Gin Asp Ala Pro 
65 70 75 



<210> 22 
<211> 75 
<212> PRT 

<213> Streptomyces ambof aciens 

<400> 22 tt _ 

Met Ser Asn Pro Phe Glu Asp Thr Glu Ala Thr Tyr Val Val Leu Val 
± 5 10 15 

Asn Asp Glu Gly Gin His Ser Leu Trp Pro Ser Phe Ala Glu Val Pro 
20 25 30 

Ala Gly Trp Ser Val Val Val Pro Glu Thr Asp Arg Gin Ser Cys Leu 
35 40 45 

Asp Tyr He Asn Glu Asn Trp Thr Asp Met Arg Pro Lys Ser Leu Val 
50 55 60 

Glu Ala Met Ala Thr Ala Gly Gin Asp Ala Pro 
65 70 75 



<210> 23 
<211> 1212 
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<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1212) 

<400> 23 

atg ggt gag gcc gtg acg gga ccg atg gag ctg age aag gac gcg gac 4 8 

—Me t- Gly Glu -Ala- VsLT~TYir~G ly ~ Pr o"Met: ~G lu~ Leu~S er~Ly s~ Asp~ £Ii~~Asp ~~~~ 
15 10 15 

gcc egg ggg ctg ctt gag tgg ttc gcg tac aac agg acg cgt cat ccg 96 
Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro 
20 25 30 

gtg ttc tgg gac gag acc cga cag gcg tgg cag gtc ttc ggc tac gac 144 
Val Phe Trp Asp Glu Thr Arg Gin Ala Trp Gin Val Phe Gly Tyr Asp 
35 40 45 

gac tac gtg acg gtg teg aac aac ccg cag ttc ttc tec teg gac ttc 192 
Asp Tyr Val Thr Val Ser Asn Asn Pro Gin Phe Phe Ser Ser Asp Phe 
50 t r .55 60 

aac atg gtg atg ccg acg ccg ccc gaa ctg gag atg ate ate ggt ccg 240 
Asn Met Val Met Pro Thr Pro Pro Glu Leu Glu Met He He Gly Pro 
65 70 75 " 80 

ggc acg ate ggc gcg ctg gac ccg ccc gcg cac gga ccg atg cgc aag 2 88 
Gly Thr He Gly Ala Leu Asp Pro Pro Ala Kis Gly Pro Met Arg Lys 
85 9 0 95 

ctg gtg age cag gcg ttc acc ccc cga egg ate gcc egg ctg gag ccc 33 6 
Leu Val Ser Gin Ala Phe Thr Pro Arg Arg He Ala Arg Leu Glu Pro 
100 105 110 

agg gtg cgc gcg ate acc gag gag etc ctg gac aag gtg ggg cag cag 384 
Arg Val Arg Ala He Thr Glu Glu Leu Leu Aso Lys Val Gly Gin Gin 
115 120 125 

gac gtc gtc gac gcc gtg ggt gac ctg tec tac gcg ctg ccg gtc ate 432 
Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val He 
130 135 140 

gtg ate gcc gaa ctg ctg ggc ata ccc gcc ggc gac cgt gac ctg ttc 480 
Val He Ala Glu Leu Leu Gly He Pro Ala Gly Asp Arg Asp Leu Phe 
i45 150 155 160 

egg gag tgg gtc gac acc ctg ctg acg aac gag ggc ctg gag tac ccg 52 8 
Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro 
165 170 175 

aac etc ccg gac aac ttc acc gag acg ate gcg ccc gcg etc aag gag 576 
Asn Leu Pro Asp Asn Phe Thr Glu Thr He Ala Pro Ala Leu Lvs Glu 
180 185 190 

atg acc gac tac etc ctg aag cag ate cac gcc aag egg gac gcg ccc 624 
Met Thr Asp Tyr Leu Leu Lys Gin He Kis Ala Lys Arg Asp Ala Pro 
155 200 205 



gcc gac gac ctg gtc age ggg ctg gtc cag gcg gag cag gac ggc cgc 



672 
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Ala Asp Asp Leu Val Ser Gly Leu Val. Gin Ala Glu Gin Asp Gly Arg 
210 215 220 

egg ctg acc gac gtc gag ate gtc aac ate gtc geg ctg etc ctg aeg 720 

Arg Leu Thr Asp Val Glu lie Val Asn lie Val Ala Leu Leu Leu Thr 

225 230 235 240 



<?cg ggg cac gtc tec tec age acc ctg etc age aac ctg ttc ctg gtc 
Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu ?he Leu Val 
245 250 255 



etc atg gag aag ggc cag atg gtg ate gee tgg age cag tec gec aac 
Leu Met Glu Lys Gly Gin Met Val lie Ala Trp Ser Gin Ser Ala Asn 
305 310 315 320 



768 



ctg gag gag aac ccg cag gcg ctg gag gac ctg egg gee gat cgc tec 816 
Leu Glu Glu Asn Pro Gin Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser 
260 265 270 

ctg gtg ccc ggc gcg ate gag gag acg ctg cgc tac cgc age ccc ttc 864 
Leu Val Pro Gly Ala lie Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe 
275 280 285 

aac aac ate ttc egg ttc gtc aag gag gac acc acc gtc etc ggt ccg 912 
Asn Asn lie Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Gly Pro 
290 295 300 



960 



egg gac ccc egg cac ttc ccg gac ccg gac acc ttc gac ate cgc cgc 1008 
Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp lie Arg Arg 
325 330 335 

teg gac ggc acc egg cac atg gec ttc ggg cac ggc ate cac cac tgc 1056 
Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly lie His His Cys 
340 345 350 

ctg ggt gec gec etc gee cgc ctg gag ggc aag gtc atg etc gaa etc 1104 
Leu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu Leu 
355 360 365 

etc ctg gac egg gtc caa ggc ttc cgc ate gac cac gag cac acc gtg 1152 
Leu Leu Asp Arg Val Gin Gly Phe Arg lie Asp His Glu His Thr Val 
370 375 380 

ttc tac gag gee gac cag etc act ccg aag tac ctg ccc gtc egg gtc 1200 
Phe Tyr Glu Ala Asp Gin Leu Thr Pro Lys Tyr Leu Pro Val Arg Val 
385 390 395 400 

gac tgg aac tga 1212 
Asp Trp Asn 



<210> 24 
<2il> 403 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 24 

Met Gly Glu Ala Val Thr Gly Pro Met Glu Leu Ser Lys Asp Ala Asp 
15 10 15 



Ala Arg Gly Leu Leu Glu Trp Phe Ala Tyr Asn Arg Thr Arg His Pro 
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20 25 



30 



Val Phe Trp Asp Glu Thr Arg Gin Ala Trp Gin Val Phe Gly Tyr Asp 
35 ao 45 

Asp Tyr Val Thr Val Ser Asn Asn Pro Gin Phe Phe Ser Ssr Asp =>he 
50 55 60 

Asn Met Val Met Pro T hr Pro Pro Glu L eu Glu Me t H e He Gly Pro 

65 ~~ 7 0 " ~~ 75 ~ ' " 80 

Gly Thr He Gly Ala Leu Asp Pro Pro Ala His Gly Pro Met Arc Lys 
85 90 95 

Leu Val Ser Gin Ala Phe Thr Pro Arg Arg He Ala Arg Leu Glu Pro 
100 105 110 

Arg Val Arg Ala He Thr Glu Glu Leu Leu Asp Lys Val Gly Gin Gin 
115 120 ' 125 

Asp Val Val Asp Ala Val Gly Asp Leu Ser Tyr Ala Leu Pro Val He 
130 135 140 

Val He Ala Glu Leu Leu Gly He Pro Ala Gly Asp Arg Asp Leu Pre 
145 150 155 160 

Arg Glu Trp Val Asp Thr Leu Leu Thr Asn Glu Gly Leu Glu Tyr Pro 
165 170 175 

Asn Leu Pro Asp Asn Phe Thr Glu Thr He Ala Pro Ala Leu Lys Glu 
180 185 190 

■ Met Thr Asp Tyr Leu Leu Lys Gin He His Ala Lys Arg Asp Ala P-o 
195 200 205 

Ala Asp Asp Leu Val Ser Gly Leu Val Gin Ala Glu Gin Asp Gly Arcr 
210 215 220 

Arg Leu Thr Asp Val Glu He Val Asn He Val Ala Leu Leu Leu Thr 
225 230 235 240 

Ala Gly His Val Ser Ser Ser Thr Leu Leu Ser Asn Leu Phe Leu Val 
245 250 255 

Leu Glu Glu Asn Pro Gin Ala Leu Glu Asp Leu Arg Ala Asp Arg Ser 
260 26 5 270 

Leu Val Pro Gly Ala He Glu Glu Thr Leu Arg Tyr Arg Ser Pro Phe 
275 280 285 

Asn Asn He Phe Arg Phe Val Lys Glu Asp Thr Thr Val Leu Glv ^ 0 
290 295 300 

Leu Met Glu Lys Gly Gin Met Val He Ala Trp Ser Gin Ser Ala *sn 
j05 310 315 320 

Arg Asp Pro Arg His Phe Pro Asp Pro Asp Thr Phe Asp He A-rg »r- g 
325 330 335 

Ser Asp Gly Thr Arg His Met Ala Phe Gly His Gly He His His Cys 
340 345 350 
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Lreu Gly Ala Ala Leu Ala Arg Leu Glu Gly Lys Val Met Leu Glu j_,eu 

355 360 365 

Leu Leu Asp Arg Val Gin Gly Phe Arg lie Asp His Glu Kis Thr Val 

370 375 380 

Phe Tyr Glu Ala Asp Gin Leu Thr Pro Lys Tyr Leu Pro Val Arg Val 

385 390 395 400 

Asp Trp Asn 



<210> 25 
<211> 540 
<212> ADjSJ 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (540) 

<220> 

<221> CDS 

<222> (190) . . (540) 

<400> 25 

ctg aac ccg agg gtc teg tec egg agt cca ggg ccg tec cga gec ggc 

Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly 

1 5 10 15 



ate gag tec ggc gtg acc gtg gac ttc ccc gtc cga cgc gtc tac tac 
lie Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr 
65 70 75 80 



48 



cct gga cct cac gac cgc ccg ata agg age gec gec ate gec gag aac 9 6 

Pro Gly Pro His Asp Arg Pro lie Arg Ser Ala Ala lie Ala Glu Asn 
20 25 30 

aca gec gag etc cct gec egg egg gtc ggc agg ate aag ccg tgc egg 144 

Thr Ala Glu Leu Pro Ala A-rg Arg Val Gly Arg He Lys Pro Cys Arg 
35 40 45 

ctg ate agg etc gag cag cac ate gac ccg cgc ggc age etc tec gtg 192 

Leu He Arg Leu Glu Gin His He Asp Pro Arg Gly Ser Leu Ser Val 

50 55 60 



240 



atg cat ggc cag acc cag tec tct ccc ccg cgc ggc ctg cac gcg cac 2 88 

Met His Gly Gin Thr Gin Ser Ser Pro Pro Arg Gly Leu His Ala Kis 

85 90 95 

cgc acc ctg gaa caa etc gtc ate gec gtc cac ggc gec ttc tec ate 336 

Arg Thr Leu Glu Gin Leu Val lie Ala Val Kis Gly Ala Phe' Ser He 
100 105 110 

acc etc gac gac ggc ttc cag cac gec acc tac cgt ctg gac gaa ccc 384 

Thr Leu Asp Asp Gly Phe Gin His Ala Thr Tyr Arg Leu Asp Glu Pro 
115 120 125 

gga gee gga etc tgc ate ggc ccc atg gtc tgg cgc gtc ctg aag gac 43 2 
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Gly Ala Gly Leu Cys lie Gly Pro Met Val Trp Arg Val Leu Lys Asp 
130 135 140 

ttc gac ccc gac acc gtg gcc ctg gtc etc gec teg cag cac tac gag 480 
Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gin Kis Tyr Glu 
145 150 155 160 

gag tec gac tac tac cgc gac tac gac acc ttc ctg cat gac gca egg 528 
Glu Ser Asp Tyr Tyr Arg Asp Tyr ^Asp Thr Phe Leu Kis Asp Ala Arg 

~~T"6"5~ ~~ 17 0 ' 175'""' 

age etc aca tga 540 
Ser Leu Thr 

180 



<210> 26 
<211> 179 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 26 

Leu Asn Pro Arg Val Ser Ser Arg Ser Pro Gly Pro Ser Arg Ala Gly 
15 10 15 

Pro Gly Pro His Asp Arg Pro lie Arg Ser Ala Ala lie Ala Glu Asn 
20 25 30 

Thr Ala Glu Leu Pro Ala Arg Arg Val Gly Arg lie Lys Pro Gys Arg 
35 40 45 

Leu lie Arg Leu Glu Gin His He Asp Pro Arg Gly Ser Leu Ser Val 
5Q 55 60 

He Glu Ser Gly Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr Tyr 
65 70 75 ~ "* 80 

Met His Gly Gin Thr Gin Ser Ser Pro Pro Arg Gly Leu His Ala His 
85 90 95 

Arg Thr Leu Glu Gin Leu Val He Ala Val His Gly Ala Phe Ser He 
100 105 110 

Thr Leu Asp Asp Gly Phe Gin His Ala Thr Tyr Arg Leu Asp Glu Pro 
115 120 125 

Gly Ala Gly Leu Cys He Gly Pro Met Val Trp Arg Val Leu Lys Aso 
130 135 - 140 

Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gin His Tyr Glu 
145 150 155 160 

Glu Ser Asp Tyr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala Arg 
165 170 175 

Sei" Leu Thr 



<210> 27 
<211> 116 
<212> PRT 
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<213> Strep tomyces ambofaciens 
<400> 27 

Val He Glu Ser Glv Val Thr Val Asp Phe Pro Val Arg Arg Val Tyr 
1.5 10 15 

Tvr Met His Gly Gin Thr Gin Ser Ser Pro Pro Arg Gly Leu His Ala 
20 25 30 

His Arg Thr Leu Glu Gin Leu Val He Ala Val His Gly Ala Phe Ser 
35 40 45 

He Thr Leu Asp Asp Gly Phe Gin His Ala Thr Tyr Arg Leu Asp Glu 
50 55 60 

t>-o Gly Ala Gly Leu Cys He Gly Pro Met Val Trp Arg Val Leu Lys 
~65 " 70 75 30 

asp Phe Asp Pro Asp Thr Val Ala Leu Val Leu Ala Ser Gin His Tyr 
85 90 95 

Glu Glu Ser Asp Tvr Tyr Arg Asp Tyr Asp Thr Phe Leu His Asp Ala 
100 105 HO 

Arg Ser Leu Thr 
115 



<210> 28 
<211> 1167 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1167) 

<400> 28 

atg acc ate ccc ttc etc gac gcg ggc gec ggc tac egg gag ttg cga 

Met ^hr He Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg 
15 10 15 

gec gag ate gac gcg gec ctg cag egg gtg tec gec tec ggc cgc tat 
Ala Glu He Asp Ala Ala Leu Gin Arg Val Ser Ala Ser Gly Arg Tyr 
20 25 30 

ctg etc gac gcg gaa etc gcg gec ttc gag gag gag ttc gec gcg tac 
Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr 
35 40 45 

tgc gac aac gac cac tgt gtg gcg gtg ggc agt ggc tgc gac gcg ctg 
Cys Asp Asn Asp His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu 
50 55 60 

gag ctg tec ctg egg gcg ctg gac ate ggt ccc ggg gac gag gtg gtg 
Glu Leu Ser Leu Arg Ala Leu Asp He Gly Pro Gly Asp Glu Val Val 
65 70 75 80 

gtg ccc gcg cac acc ttc ate ggg acc tgg ctg gec gtg tec get acc 
Val Pro Ala His Thr Phe He Gly Thr Trp Leu Ala Val Ser Ala Thr 



48 



96 



144 



192 



240 



288 
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85 90 95 

ggg gca egg ccg gtg gec gtc gac ccg acg ccg gac ggg etc tec etc 33 6 

Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu 
100 105 110 



gac ccg gcg ctg gtg gag gcg gcg etc acc cct egg ace aga gee ctg 
Asp Pro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu 
115 120 125 



384 



atg ccg gtg cac ctg cac ggg cac ccg gec gac etc gac ccg eta ctg 432 
Met Pro Val Kis Leu His Gly Kis Pro Ala Asp Leu Asp Pro Leu Leu 
130 135 140 

gcg ate gee gga egg cac ggc ctg gee gtg gtc gag gac gee gcg cag 480 
Ala lie Ala Gly Arg His Gly Leu Ala Val Val Glu Asp' Ala Ala Gin 
145 150 155 160 

gec cac ggc gee cgt tac egg ggc cgc agg ate ggc teg ggc cac gtg 52 8 
Ala Kis Gly Ala Arg Tyr Arg Gly Arg Arg lie Gly Ser Gly His Val 
165 170 175 

gtc gcg ttc age ttc tac cce ggc aag aac etc ggc gec atg ggg gac 576 
Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp 
180 185 190 

QQc <29"c gcg gtg gtc acg ggt gac tec ggt gtg gee gag egg ate egg 62 4 
Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg lie Arg 
195 200 205 

ttg ctg cgc aac tgc ggc teg egg gag aag tac egg cac gag gtg cgc 672 
Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg 
210 215 220 

teg acc cac tec egg etc gac gag ttc cag gcg gee gtg ctg egg gec 720 
Ser Thr His Ser Arg Leu Asp Glu Phe Gin Ala Ala Val Leu Arg Ala 
225 230 235 240 

aaa ctg ccg egg etc gac gcg tgg aac gee cgc egg gec ggc acg gee 768 
Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala 
245 250 255 

gaa egg tac ggg egg gee ctg ggt ccg gta ccg cag ate gec gtc ccg 816 
Glu Arg Tyr Gly Arg Ala Leu Gly Pro Val Pro Gin lie Ala Val Pro 
260 265 270 

gtc acc get ccc tgg gee gac ccg gtg tgg cac ctg tac gtg ate cgc 864 
Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val lie Arg 
275 280 285 

tgc gcg gag cgc gac gag ctg cgc cgc egg ctg gaa cga gee ggg gtc 912 
Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val 
290 295 300 

cag acc ctg ate cac tac ccc gtg ccc ccg cac egg tec ccg gec tac 960 
Gin Thr Leu lie His Tyr Pro Val Pro Pro His Arg Ser Pro Ala Tyr 
305 310 315 320 

gec gac gac ccg gec ggc gca ccg gcg ggg acc cac ccg etc agt gag 1008 
Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu 
325 330 335 
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cgc ctg gcg gcg cag age 
Arg Leu Ala Ala Gin Ser 
340 

gag gac gag gec cgc gec 
Glu Asp Glu Ala Arg Ala 
355 

ggg ctg gcg gcg tac ccg 
Gly Leu Ala Ala Tyr Pro 
370 

acg gag aaa cga tga 
Thr Glu Lys Arg 
385 



etc age ctt ccc ctg gga 
Leu Ser Leu Pro Leu Gly 
345 

gtc gtg gcg gcg gtc egg 
Val Val Ala Ala Val Arg 
360 

acg ccg gac ggc cag cgt 
Thr Pro Asp Gly Gin Arg 
375 380 



ccg cac etc ggg 105 6 
Pro His Leu Gly 
350 

gcg gcg tec gca 1104 

Ala Ala Ser Ala 

365 

ttt cct eta gtg 1152 
Phe Pro Leu Val 



1167 



<210> 29 
<211> 388 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 29 ' 

Met Thr lie Pro Phe Leu Asp Ala Gly Ala Gly Tyr Arg Glu Leu Arg 
! 5 10 15 

Via Glu He Asp Ala Ala Leu Gin Arg Val Ser Ala Ser Gly Arg Tyr 
20 25 30 

Leu Leu Asp Ala Glu Leu Ala Ala Phe Glu Glu Glu Phe Ala Ala Tyr 
35 40 45 

Cys Asp Asn Aso His Cys Val Ala Val Gly Ser Gly Cys Asp Ala Leu 
50 55 60 

Glu Leu Ser Leu Arg Ala Leu Asp He Gly Pro Gly Asp Glu Val Val 
65 70 75 80 

Val Pro Ala His Thr Phe lie Gly Thr Trp Leu Ala Val Ser Ala Thr 
35 90 95 

Gly Ala Arg Pro Val Ala Val Asp Pro Thr Pro Asp Gly Leu Ser Leu 
100 105 HO 

Asp ^ro Ala Leu Val Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Leu 
115 120 125 

Met Pro Val His Leu His Gly His Pro Ala Asp Leu Asp Pro Leu Leu 
130 135 140 

Ala He Ala Gly Arg His Gly Leu Ala Val Val Glu Asp Ala Ala Gin 
145 150 155 160 

His Gly Ala Arg Tyr Arg Gly Arg Arg He Gly Ser Gly His Val 
165 170 175 

Val Ala Phe Ser Phe Tyr Pro Gly Lys Asn Leu Gly Ala Met Gly Asp 
180 "* 185 190 

Gly Gly Ala Val Val Thr Gly Asp Ser Gly Val Ala Glu Arg He Arg 
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195 200 205 

Leu Leu Arg Asn Cys Gly Ser Arg Glu Lys Tyr Arg His Glu Val Arg 
210 215 220 

Ser Thr His Ser Arg Leu Asp Glu Phe Gin Ala Ala Val Leu Arg Ala 
225 230 235 240 

Lys Leu Pro Arg Leu Asp Ala Trp Asn Ala Arg Arg Ala Gly Thr Ala 
2 ^ 5 _ _ 25 _ 0 2 55 

Glu Arg Tyr Glv Arg Ala Leu Gly Pro Val Pro Gin lie Ala Val Pro 
260 265 270 

Val Thr Ala Pro Trp Ala Asp Pro Val Trp His Leu Tyr Val He Arg 
275 280 285 

Cys Ala Glu Arg Asp Glu Leu Arg Arg Arg Leu Glu Arg Ala Gly Val 
290 295 300 

Gin Thr Leu He His Tvr Pro Val Pro Pro His Arg Ser Pro Ala Tyr 
305 310 315 320 

Ala Asp Asp Pro Ala Gly Ala Pro Ala Gly Thr His Pro Leu Ser Glu 
325 330 335 

Arg Leu Ala Ala Gin Ser Leu Ser Leu Pro Leu Gly Pro His Leu Gly 
340 345 350 

Glu Asp Glu Ala Arg Ala Val Val Ala Ala Val Arg Ala Ala Ser Ala 
355 360 365 

Gly Leu Ala Ala Tyr Pro Thr Pro Asp Gly Gin Arg Phe Pro Leu Val 
370 375 380 

Thr Glu Lys Arg 
385 



<210> 30 
<211> 909 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<22i> CDS 

<222> (1) . . (909) 

<220> 

<221> CDS 

<222> (10) . . (909) 

<220> 

<221> CDS 

<222> (28) . . (909) 

<400> 30 

atg acc gag gtc atg tea ggg cat ccc gga atg aaa ggg ate ate etc 

Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly He He Leu 
15 10 15 
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48 



144 



l92 



240 



288 



336 



384 



g-a age age aga ggg acc egc eta cgc ccc ttg acc ggc acg ctg ,cc 9 6 
Ala Glv civ Gly Glv Thr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser 
20 25 30 

aag caa' ctg ctg ccc gtc tac gac aag ccg atg ate tac tac ccg ctg 
Lys Gin Leu Leu Pro Val Tyr Asp Lys Pro Met He Tyr Tyr Pro Leu 
35 40 45 

tec gtc ctg atg ctg ggc ggc ate cgc gag ate etc gtc gtc tec tec 
Ser Val Leu Met Leu Gly Gly He Arg Glu He Leu Val Val Ser Ser 
50 55 60 

acc cag cac ate gag ctg ttc cag egg ctg ctg ggc gac ggc tee cgc 
m hr Gln F i s He Glu Leu Phe Gin Arg Leu Leu Gly Asp Gly Ser Arg 
65 70 75 80 

etc ggc etc gac ate acc tac gee gaa cag gee gag ccc gag ggc ata 
Leu Gly Leu Aso He Thr Tyr Ala Glu Gin Ala Glu Pro Glu Gly He 
85 90 95 

gcg cag gee ate acc ate ggc acc gac cac ate ggc gac tea ccg gtc 
Ala Gin Ala He Thr He Gly Thr Asp His He Gly Asp Ser Pro Val 
100 105 HO 

gcg etc ate ctg ggc gac aac ate ttc cac ggc ccc ggc ttc teg gee 
Ala Leu He Leu Gly Asp Asn He Phe His Gly Pro Gly Phe Ser Ala 
115 120 125 

gtg etc cag ggc age ate cgc cac etc gac ggc tgt gtg ctg ttc ggc 43 2 
Val Leu Gin Gly Ser He Arg His Leu Asp Gly Cys Val Leu Phe Gly 
130 135 140 

tac ccg gtc age gac ccg aag cgc tac ggc gtc ggc gag ate gac gac 4 80 
Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu He Asp Asp 
145 " 150 155 160 

cag ggc gta ctg ctg tec ctg gag gag aaa ccg gee egg ccc cgc tec 
Gin Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser 
165 170 175 

aac etc gee gtc acc ggc etc tac etc tac gac aac gac gtg gtc gac 
Asn Leu Ala Vai Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp 
180 185 190 

ate gec aag aac ate egg ccc teg gcg cgc ggc gaa etc gag ate acg 
He Ala Lys Asn He Arg Pro Ser Ala Arg Gly Glu Leu Glu He Thr 
195 200 205 

gac gtc aac agg acc tac ctg gag cag aaa cgc gee egg etc ate gaa 
Asp Val Asn Arg Thr Tyr Leu Glu Gin Lys Arg Ala Arg Leu He Glu 
210 215 220 

ctg ggc cac ggc ttc gee tgg etc gac atg ggc acc cac gac tec etc 
Leu Gly His Glv Phe Ala Tro Leu Asp Met Gly Thr His Asp Ser Leu 
225 "* 230 235 240 

etc cag ggc ggc cag tac gtc cag etc ate gag cag cgc cag gga gtg 7 68 
Leu Gin Gly Gly Gin Tvr Val Gin Leu He Glu Gin Arg Gin Gly Val 
245 250 255 



528 



576 



624 



672 



720 
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egg ate gee tge ate gag gag ate gee ctg egc atg ggc ttc ate gac 816 

Arg lie Ala Cys lie Glu Glu lie Ala Leu Arc Met Gly Phe lie Asp 

260 265 270 

gee gac ace etc cac egg etc ggc egc gaa ctg ggc ace tec gga tac 864 

Ala Asp Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr 

275 280 285 

ggc gcg tac ctg atg gag gtg gee acc cgt gca ggc ace gaa tga 909 

Gly Ala "Tyr Leu "Met Glu" VaT Ala Thr" Arg" Ala "Gly Thr Glu 

290 295 300 



<210> 31 
<211> 302 
<212> PRT 

<213> Streptoinyces ambof aciens 
<400> 31 

Met Thr Glu Val Met Ser Gly Arg Pro Gly Met Lys Gly lie lie Leu 
15 10 15 

Ala Gly Gly Gly Gly Thr A.rg Leu Arg Pro Leu Thr Gly Thr Leu Ser 
20 25 30 

Lys Gin Leu Leu Pro Val Tyr Asp Lys Pro Met lie Tyr Tyr Pro Leu 
35 40 45 

Ser Val Leu Met Leu Gly Gly He Arg Glu He Leu Val Val Ser Ser 
50 55 60 

Thr Gin Kis He Glu Leu Phe Gin Arg Leu Leu Gly Asp Gly Ser Arg 
65 70 75 80 

Leu Gly Leu Asp He Thr Tyr Ala Glu Gin Ala Glu Pro Glu Gly He 
85 90 95 

Ala Gin Ala He Thr He Gly Thr Asp His lie Gly Asp Ser Pro Val 
100 105 110 

Ala Leu He Leu Gly Asp Asn He Phe His Gly Pro Gly Phe Ser Ala 
115 120 125 

Val Leu Gin Gly Ser He Arg Kis Leu Asp Gly Cys Val Leu Phe Gly 
130 135 140 

Tyr Pro Val Ser Asp Pro Lys Arg Tyr Gly Val Gly Glu He Asp Asp 
145 150 155 " ~ 160 

Gin Gly Val Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser 
165 170 175 

Asn Leu Ala Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp 
180 185 190 

He Ala Lys Asn He Arg Pro Ser Ala Arg Gly Glu Leu Glu He Thr 
195 200 205 

Asp Val Asn Arg Thr Tyr Leu Glu Gin Lys Arg Ala Arg Leu He Glu 
210 215 220 
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L-u Gly His Glv Phe Ala TrD Leu Asp Met Gly Thr His Asp Ser Leu 
225 " ~ 230 235 240 

Leu Gin Glv Glv Gin Tyr Val Gin Leu lie Giu Gin Arg Gin Gly Val 
245 250 255 

Ara lie Ala Cvs He Glu Glu He Ala Leu Arg Met Gly Phe He Asp 
260 265 270 

Ha Asd Thr Leu His Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr 
275 280 285 

G"»y Ala Tyr Leu Met Giu Val Ala Thr Arg Ala Gly Thr Glu 
290 295 300 



<210> 32 
<211> 299 
<212> PRT 

<213> Streptomyces ambofaciens 

<400> 32 ^ _ 

Val Met Ser Gly Arg Pro Gly Met Lys Gly. He He Leu Ala Gly Gly 
15 10 i5 

Gly Gly ^hr Arg Leu Arg Pro Leu Thr Gly Thr Leu Ser Lys Gin Leu 
20 25 3 0 

Leu Pro Val Tyr Asp Lys Pro Met He Tyr Tyr Pro Leu Ser Val Leu 
3 5 40 . 45 

Met Leu Gly Gly He Arg Glu lie Leu Val Val Ser Ser Thr Gin His 
50 55 60 

He Glu Leu Phe Gin Arg Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu 
65 70 75 80 

Asp He Thr Tyr Ala Glu Gin Ala Glu Pro Glu Gly He Ala Gin Ala 
85 90 95 

He Thr He Gly Thr Asp His He Gly Asp Ser Pro Val Ala Leu He 
100 105 HO 

Leu Gly Asp Asn He Phe His Gly Pro Gly Phe Ser Ala Val Leu Gin 
115 120 ^ 125 

GW Ser He Arg His Leu Aso Gly Cys Val Leu Phe Gly Tyr Pro Val 
130 135 140 

Ser ^sp Pro Lys Arg Tvr Gly Val Gly Glu He Asp Asp Gin Gly Val 
145 ~ ' 150 155 160 

Leu Leu Ser Leu Glu Glu Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala 
. 165 170 175 

Val Thr Gly Leu Tyr Leu Tyr Asp Asn Asp Val Val Asp lie Ala Lys 
180 185 190 

Asn He Arg Pro Ser Ala Arg Gly Glu Leu Glu He Thr Asp Val Asn 
195 200 205 
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Arg Thr Tyr Leu Glu Gin Lys Arg Ala Arg Leu lie Glu Leu Gly His 
210 215 220 

Gly Phe Ala Trp Leu' Asp Met Gly Thr His Asp Ser Leu Leu Gin Gly 
225 230 235 240 

Gly Gin Tyr Val Gin Leu lie Glu Gin Arg Gin Gly Val Arg lie Ala 
245 250 255 

"""Cys'lTe" GllT~GllI~ire~Ar^ "Thr 
260 265 270 

Leu Kis Arg Leu Gly Arg Glu Leu Gly Thr Ser Gly Tyr Gly Ala Tyr 
275 280 285 

Leu Met Glu Val Ala Thr Arg Ala Gly Thr Glu 
290 295 



<210> 33 
<211> 293 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 33 

Gly Met Lys Gly lie lie Leu Ala Gly Gly Gly Gly Thr Arg Leu Arg 
15 10 15 

Pro Leu Thr Gly Thr Leu Ser Lys Gin Leu Leu Pro Val Tyr Asp Lys 
20 25 30 

Pro Met lie Tyr Tyr Pro Leu Ser Val Leu Met Leu Gly Gly lie Arg 
35 40 45 

Glu lie Leu Val Val Ser Ser Thr Gin His lie Glu Leu Phe Gin Arg 
50 55 60 

Leu Leu Gly Asp Gly Ser Arg Leu Gly Leu Asp He Thr Tyr Ala Glu 
65 70 75 80 

Gin Ala Glu Pro Glu Gly He Ala Gin Ala He Thr He Gly Thr Asp 
85 90 95 

His He Gly Asp Ser Pro Val Ala Leu He Leu Gly Asp Asn He Phe 
100 105 110 

Kis Gly Pro Gly Phe Ser Ala Val Leu Gin Gly Ser He Arg His Leu 
115 120 125 

Asp Gly Cys Val Leu Phe Gly Tyr Pro Val Ser Asp Pro Lys Arg Tyr 
130 135 140 

Gly Val Gly Glu He Asp Asp Gin Gly Val Leu Leu Ser Leu Glu Glu 
145 150 155 160 

Lys Pro Ala Arg Pro Arg Ser Asn Leu Ala Val Thr Gly Leu Tyr Leu 
165 170 175 



Tyr Asp Asn Asp Val Val Asp He Ala Lys Asn He Arg Pro Ser Ala 
ISO 185 190 
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Arg Gly Glu Leu 
195 

Lys Arg Ala Arg 
210 

Met Gly Thr His 
225 

lie Glu Gin Arg 



Leu Arg Met Gly 
260 

Glu Leu Gly Thr 
275 

Arg Ala Gly Thr 
290 



Glu lie Thr Asp 
200 

Leu lie Glu Leu 
215 

Asp Ser Leu Leu 
230 

Gin Gly Val Arg 
245 

Phe lie Asp Ala 



Ser Gly Tyr Gly 
280 

Glu 



Val Asn Arg Thr 



Gly His Gly Phe 
220 

Gin Gly Gly Gin 
235 

lie Ala Cys lie 
250 

Asp Thr Leu His 
265 

Ala Tyr Leu Met 



Tyr Leu Glu Gin 
205 

Ala Trp Leu Asp 



Tyr Val Gin Leu 
240 

Glu Glu He Ala 
255 

Arg Leu Gly Arg 
270 

Glu Val Ala Thr 
285 



<2i0> 


34 


<211> 


1038 


<212> 


AJDN 


<213> 


Streptomyces < 


<220> 




<221> 


CDS 


<222> 


(1) . . (1038) 


<400> 


34 


gtg cag gca ccg aat 


Val Gin Ala Pro Asn 


1 


5 



48 



96 



144 



10 15 

cga egg ccg ccg gec egg ate etc gtc acc ggg ggc gee ggc ttc ate 

Arg Arg Pro Pro Ala Arg He Leu Val Thr Gly Gly Ala Gly Phe He 

20 25 30 

ggc teg cgc ttc gtg aac gcg ctg ctg gac ggc tec ctg ccg gag ttc 

Gly Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe 

35 40 45 

ggc aaa ccc gag gtg agg gtg etc gac gcg etc acc tac gcg ggc aac 132 

Gly Lys Pro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn 

50 55 60 

ctg gee aat ctg gee ccg gtg ggc gac tgt ccc egg ctg egg ate ttc 

Leu Ala Asn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg He Phe 

65 70 75 80 

ccg ggg gac ate cgc gac cgc ggc gcg gtc acc cag gcg atg gcg ggg 

Pro Gly Asp He Arg Asp Arg Gly Ala Val Thr Gin Ala Met Ala Gly 

85 90 95 

gtc gac ctg gtg gtg cac ttc gcg gec gag teg cac gtg gac cgc teg 336 

Val Asp Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser 

100 105 HO 



240 



288 
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ate gac gac gec gac gec ttc gtg cgc acc aac gtg ctg ggc acc cag 
Ho Asp Asd Ala Asp Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gin 
115 120 125 

gtc etc etc cag gag gca ctg gec gta cgc ccc ggg ctg ttc gtg cac 
Val Leu Leu Gin Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val His 
130 135 140 

-a*-c - tca-acg_gac-gag_g^^ 
Val Ser Thr Asp Glu Val Tyr Gly Ser He Glu Glu Gly Ser Trp Pro 
145 150 155 • 160 

gag gag cac ccg ctg aac ccc aac teg ccc tac gec gec teg aag gcg 
Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala 
165 170 175 

tec tec gac ctg ctg gcg ctg gee cac cac cgc acg cac gga ctg ccg 
Ser Ser Asp Leu Leu Ala Leu Ala His His Arg Thr His Gly Leu Pro 
180 185 190 

gtg tgc gtc acc cgc tgc tec aac aac tac ggg ccc tac cag tac ccg 
Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gin Tyr Pro 
195 200 205 

gag aag ate ate ccg ctg ttc acc age age etc etc gac ggc ggg acc 
Glu Lys lie He Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr 
210 215 220 

gtc ccg etc tac ggg gac ggc ggc aac egg cgc gac tgg ctg cac gtg 
Val Pro Leu Tyr Glv Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val 
225 230 235 240 

gac gac cac tgc egg ggc ate gee ctg gtg gee egg ggc ggc egg ecc 
.Asp Asp His Cys Arg Gly He Ala Leu Val Ala Arg Gly Gly Arg Pro 
245 250 255 

ggc gag" gtc tac aac ate ggc ggc ggc acc gag ctg age aac gtc gag 
Gly Glu Val Tyr Asn He Gly Gly Gly Thr Glu Leu Ser Asn Val Glu 
260 265 270 

etc acg gag cgt ctg ctg aaa ctg tgc gga gee gac tgg teg gcg gtg 
Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val 
275 280 285 

egg egg gtg ccc gac cgc aag ggc cac gac egg cgc tac tec gtc gac 
Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp 
290 295 300 

tac acc aag ate gcg gac gag ctg ggt tac gcg ccg egg ate acc ate 
Tyr Thr Lys He Ala Aso Glu Leu Gly Tyr Ala Pro Arg He Thr He 
305 310 315 320 

gac gaa ggg ctg gag egg acc gtg cac tgg tac egg gag aac cgc gcg 
Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala 
325 330 335 

tgg tgg gcg ccc gcg aag agg ggg cga tga 

Trp Trp Ala Pro Ala Lys Arg Gly Arg % 
340 345 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1038 
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<2I0> 35 
<211> 345 
<2I2> PRT 

<213> Streptomyces airibof aciens 

<400> 35 o _ „ 1 

Val Gin Ala ^ro Asn Glu Thr Pro Arg Arg Pro Ala Arg Ser Ala Gly 
1 5 10 15 

*rg *ra Pro Pro Ala Arg lie Leu Val Thr Gly Gly Ala Gly Phe lie 
20 2 5 30 

Glv Ser Arg Phe Val Asn Ala Leu Leu Asp Gly Ser Leu Pro Glu Phe 
35 40 45 

Gly Lys ^ro Glu Val Arg Val Leu Asp Ala Leu Thr Tyr Ala Gly Asn 
50 55 60 

Leu Ma *sn Leu Ala Pro Val Gly Asp Cys Pro Arg Leu Arg He Phe . 
65 70 75 80 

Pro Gly Asp He Arg Asp Arg Gly Ala Val Thr Gin Ala Met Ala Gly 
85 90 95 

Val Aso Leu Val Val His Phe Ala Ala Glu Ser His Val Asp Arg Ser 
100 105 HO 

He Asp Asp Ala Aso Ala Phe Val Arg Thr Asn Val Leu Gly Thr Gin 
115 120 125 

Val Leu Leu Gin Glu Ala Leu Ala Val Arg Pro Gly Leu Phe Val Kis 
130 135 140 

Val Ser Thr Asp Glu Val Tyr Gly Ser He Glu Glu Gly Ser Trp Pro 
145 150 155 160 

Glu Glu His Pro Leu Asn Pro Asn Ser Pro Tyr Ala Ala Ser Lys Ala 
165 170 175 

Ser Ser Asp Leu Leu Ala Leu Ala His Kis Arg Thr His Gly Leu Pro 
180 185 190 

Val Cys Val Thr Arg Cys Ser Asn Asn Tyr Gly Pro Tyr Gin Tyr Pro 
195 200 205 

Glu Lys He He Pro Leu Phe Thr Ser Ser Leu Leu Asp Gly Gly Thr 
210 215 220 

Val Pro Leu Tvr Gly Asp Gly Gly Asn Arg Arg Asp Trp Leu His Val 
225 230 235 240 

Asp *.sp His Cvs .Arg Gly lie Ala Leu Val Ala Arg Gly Gly Arg Pro 
245 250 255 

Glv Glu Val Tyr Asn He Gly Gly Gly Thr Glu Leu Ser Asn Val Glu 
260 265 270 

Leu Thr Glu Arg Leu Leu Lys Leu Cys Gly Ala Asp Trp Ser Ala Val 
275 280 285 

Arg Arg Val Pro Asp Arg Lys Gly His Asp Arg Arg Tyr Ser Val Asp 
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290 295 300 

Tyr Thr Lys lie Ala Asp Glu Leu Gly Tyr Ala Pro Arg He Thr He 
305 310 315 320 

Asp Glu Gly Leu Glu Arg Thr Val His Trp Tyr Arg Glu Asn Arg Ala 
325 330 33b 

Trp Trp Ala Pro Ala Lys Arg Gly Arg 

-- — 



<210> 36 
<211> 804 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (804) 

<220> - • • . 

<221> CDS 

<222> (7) . . (804) 

<220> 

<221> CDS 

<222> (22) . . (804) 

<400> 36 

atg acg gtg acg acc gca tec gtg gac ccg etc gac ctg tgg etc cgc 48 

Met Thr Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg 

15 10 15 

egg tac cag ccg tec gcg tea ccc gee gtc egg ctg gtg tgc ttc ccg 
Arg Tyr Gin Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro 
20 25 30 



50 55 60 



ggg cac age atg ggc gcg ctg gtg gec tac gag gtc gec cgc gcg etc 

Gly His Ser Met Glv Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu 
100 105 HO 

cag cag egg gga gcg get ccg gtg cgc ctg gtg gtc tec ggg cgc egg 

Gin Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg 



96 



cac gcg ggc ggc teg gcg agt teg ttc ctg ccg ttc acc egg cag ctg 144 

His Ala Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gin Leu 
35 40 45 

ccg aac egg; ate gag gtc gtg gec gtc cag tac ccc ggg cgc cag gac 

Pro Asp Arg lie Glu Val Val Ala Val Gin Tyr Pro Gly Arg Gin Asp 



192 



240 



cgc agg age gaa ccg ctg gtc gac acc ate gag gga ctg gee gag ccc 

Arg Arg Ser Glu Pro Leu Val Asp Thr lie Glu Gly Leu Ala Glu Pro 
65 70 75 80 

ctg gee ggc ctg ctg gag gcg cag gee ggc ccc ccg gtg gtg ctg ttc 2 88 

Leu Ala Gly Leu Leu Glu Ala Gin Ala Gly Pro Pro Val Val Leu Phe 
85 90 95 



336 



384 



1er depot 

56 



115 120 125 

gcc ccc gcc gtc gac egg ccg atg acc gtg cac etc tac gac gac gac 
Ala ^ro Ala Val Aso Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp 
130 " 135 140 

cog ctg gtc gag gaa etc cgc aag etc gac ggc acc gac age cag gtg 
Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gin Val 
145 150 155 160 

ttc gcc gat ccg gag ctg etc egg ctg gtg ctg ' ccc gtg ate cgc aac 
Phe Ala Asp ^ro Glu Leu Leu Arg Leu Val Leu Pro Val lie Arg Asn 
165 170 175 

gac tac egg gcc gtg gcg gcc tac gcc cac cgc ccg ggg gcg ccg ctg 
Asp Tvr Arg Ala Val Ala Ala Tyr Ala Kis Arg Pro Gly Ala Pro Leu 
180 185 190 

gac tgc ccc etc acc gtg ttc acc ggc gcc gac gac ccc acc gtg acc 
Asp Cvs Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr 
195 200 205 

ocg acc gag gcg gcg gcc tgg cac gag gcg gcg gcg tec gac gtc gag 
Ala Ala Glu Ala Ala Ala Trp His Glu Ala Ala Ala Ser Asp Val Glu 
210 215 220 

acg cgc acc ttc ccc ggt ggc cac ttc ttc ccg tac cag egg acc gcg 
Thr Arg ^hr Phe Pro Gly Gly His Phe Phe Pro Tyr Gin Arg Thr Ala 
225 230 235 240 

gag gtg tgc ggg gcc ctg gtc gac acg etc gag ccg ctg ctg teg gcc 
Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala 
245 250 255 

ggg acg cgc ggt gtc egg egg gtc cgc ccg ggg tga 
Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly 
26 0 2 6 5 



4 32 



480 



528 



576 



624 



672 



720 



768 



804 



<210> 37 
<211> 267 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 37 

Met Thr Val Thr Thr Ala Ser Val 
1 5 

Arg Tyr Gin Pro Ser Ala Ser Pro 
2 0 

His Ala Gly Gly Ser Ala Ser Ser 

35 40 

Pro Asp Arg He Glu Val Val Ala 
5 0 5 5 

Arg Arg Ser Glu Pro Leu Val Asp 
65 70 

Leu Ala Gly Leu Leu Glu Ala Gin 



Aso Pro Leu Aso Leu Trp Leu Arg 
10 15 

Ala Val Arg Leu Val Cys Phe Pro 
25 30 

Phe Leu Pro Phe Thr Arg Gin Leu 
45 

Val Gin Tvr Pro Gly Arg Gin Asp 
60 

Thr He Glu Gly Leu Ala Glu Pro 

75 80 

Ala Gly Pro Pro Val Val Leu Phe 
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85 90 95 

Gly His Ser Met Gly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu 
100 105 110 

Gin Arg Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg 
115 120 125 

Ala Pro Ala Val Asp Arg Pro Met Thr Val Kis Leu Tyr Asp Asp Asp 

TTQ~~ ~~ T3T5 — ~T€0 

Arg Leu Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gin Val 
145 150 155 160 

Phe Ala Asp Pro Glu Leu Leu Arg Leu Val Leu Pro Val lie Arg Asn 
165 170 175 

Asp Tyr Arg Ala Val Ala Ala Tyr Ala Kis Arg Pro Gly Ala Pro Leu 
180 185 190 

Asp Cys Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr 
195 200 205 

Ala Ala Glu Ala Ala Ala Trp Kis Glu Ala Ala Ala Ser Asp Val Glu 
210 215 220 

Thr Arg Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gin Arg Thr Ala 
225 230 235 240 

Glu Val Cys Gly Ala Leu Val Asp Thr Leu Glu Pro Leu Leu Ser Ala 
245 250 255 

Gly Thr Arg Gly Val Arg Arg Val Arg Pro Gly 
260 265 



<210> 38 
<211> 265 
<212> PRT 

<213> Streptomyces amfoof aciens 
<400> 38 

Val Thr Thr Ala Ser Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr 
15 10 15 

Gin Pro Ser Ala Ser Pro Ala Val Arg Leu Val Cys Phe Pro His Ala 
20 25 30 

Gly Gly Ser Ala Ser Ser Phe Leu Pro Phe Thr Arg Gin Leu Pro Asp 
35 40 45 

Arg lie Glu Val Val Ala Val Gin Tyr Pro Gly Arg Gin Asp Arg Arg 
50 55 60 

Ser Glu Pro Leu Val Asp Thr lie Glu Gly Leu Ala Glu Pro Leu Ala 
65 70 75 80 

Gly Leu Leu Glu Ala Gin Ala Gly Pro Pro Val Val Leu Phe Gly His- 
85 90 95 



Ser Met uly Ala Leu Val Ala Tyr Glu Val Ala Arg Ala Leu Gin Arg 
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100 



1C5 HO 



Arg Gly Ala Ala Pro Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro 
115 12 0 12 d 

Ala Val Aso Arg Pro Met Thr Val His Leu Tyr Asp Asp Asp Arg Leu 
130 135 140 

Val Glu Glu Leu Arg Lys Leu Asp Gly Thr Asp Ser Gin Val Phe Ala 
145 150 155 160 

Psv ^ro Glu Leu Leu Arg Leu Val Leu Pro Val He Arg Asn Asp Tyr 
165 170 175 

Ara Ala Val *la Ala Tyr Ala His Arg Pro Gly Ala Pro Leu Asp Cys 
180 185 190 

Pro Leu Thr Val Phe Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala 
195 200 205 

Glu Ala Ala Ala Tro His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg 
210 215 220 

Thr Phe Pro Gly Gly His Phe Phe Pro Tyr Gin Arg Thr Ala Glu Val 
225 230 235 240 

Cys Gly Ala Leu Val Aso Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr 
245 250 255 

Arg Gly Val Arg Arg Val Arg Pro Gly 
2 60 2 65 



<210> 39 
<211> 260 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 39 

Val Asp Pro Leu Asp Leu Trp Leu Arg Arg Tyr Gin Pro Ser Ala Ser 
1 5 10 15 

Pro Ala Val Arg Leu Val Cys Phe Pro His Ala Gly Gly Ser Ala Ser 
20 25 30 

Ser Phe Leu Pro Phe Thr Arg Gin Leu Pro Asp Arg He Glu Val Val 
35 40 45 

Ala Val Gin Tyr Pro Gly Arg Gin Asp Arg Arg Ser Glu Pro Leu Val 
50 55 60 

Aso Thr He Glu Glv Leu Ala Glu Pro Leu Ala Gly Leu Leu Glu Ala 
65 70 75 80 

Gin Ala Gly Pro Pro Val Val Leu Phe Gly His Ser Met Gly Ala Leu 
85 90 95 

Val Ala Tyr Glu Val Ala Arg Ala Leu Gin Arg Arg Gly Ala Ala Pro 
100 105 HO 

Val Arg Leu Val Val Ser Gly Arg Arg Ala Pro Ala Val Asp Arg Pro 
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115 120 125 

Met: Thr Val His Leu Tyr Asp Asp Asp Arg Leu Val Glu Glu Leu Arg 
130 135 140 

Lys Leu Asp Gly Thr Asp Ser Gin Val ?he Ala Asp Pro Glu Leu Leu 
145 150 155 160 

Arg Leu Val Leu Pro Val lie Arg Asn Asp Tyr Arg Ala Val Ala Ala 

— — r — _ — T75 — 

Tyr Ala Kis Arg Pro Gly Ala Pro Leu Asp Cys Pro Leu Thr Val Phe 
180 185 190 

Thr Gly Ala Asp Asp Pro Thr Val Thr Ala Ala Glu Ala Ala Ala Trp 
195 200 205 

His Glu Ala Ala Ala Ser Asp Val Glu Thr Arg Thr Phe Pro Gly Gly 
210 215 220 

His Phe Phe Pro Tyr Gin Arg Thr Ala Glu Val Cys Gly Ala Leu Val 
225 230 235 - 240 

Asp Thr Leu Glu Pro Leu Leu Ser Ala Gly Thr Arg Gly Val Arg Arg 
245 250 255 

Val Arg Pro Gly 
260 



<210> 40 
<211> 1410 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) , . (1410) 

<220> 

<221> CDS 

<222> (46) . . (1410) 

<400> 40 

gtg ggc acg gtc gag tac gcc gtc cac egg cgt acc gcg gaa egg gtg 48 

Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val 
15 10 15 

agg gtc tec gcc gac acc ctg gac age ccg gtc acc gcg ctg gcg gag 9 6 
Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu 
20 25 30 

gtg ccc cgc tgg ctg gag gaa tac cac egg gcg cac cgc ttc cac gtc 144 
Val Pro Arg Trp Leu Glu Glu Tyr His Arg Ala Kis Arg Phe His Val 
35 40 45 

gag ccg ate ccc ttc gac egg etc egg egg tgg tec ttc gag ccg ggc 192 
Glu Pro lie Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro Gly 
50 55 60 
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60 

acc ggc gac ctg egg cac gag acg ggc cgc ttc ttc tec gtg gag ggg 

Thr Glv Asr> Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu Gly 

~" 65 " 70 75 80 

c*-c cgc acc age teg gac gee gat ccg gtc gee cgt gtc cag ccg ate 
L~u Arg Th- Ser Ser Asd Ala Asp Pro Val Ala Arg Val Gin Pro ile 
85 90 95 

ate gtg cag ccc gag gtg ggg ctg etc ggc ate ctg gee egg gag ttc 
xlo val Gin -ro Glu Val Gly Leu Leu Gly He Leu Ala Arg Glu Pne 
100 105 HO 

aac ggg gtg ctg cac ttc ctg atg cag gee aaa ccc gag ccc ggc aac 
So GW Sal Leu His Phe Leu Met Gin Ala Lys Pro Glu Pro Gly Asn 
" 115 120 125 

ate aac ggg ctg cag ate tec ccc acg gtg cag gee acg cgc age aac 
?ai Asn III Leu Gin He Ser Pro Thr Val Gin Ala Tnr Arg Ser Asn 
130 " 135 140 

ttc aac gag gtg cac cac ggc egg tec acc ccg ttc etc gac cac ttc 
=he Asd Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe 
1*5 " 150 155 1*0 



ate cac cgc ccc ggc cgc egg gtc ctg ate gac age ate cag ,cc gaa 
Ii- His Arg P-o Glv Arg Arg Val Leu He Asp Ser He Gin Ser G^u 
165 170 175 

cag gac gac tag ttc ctg cac aag cgc aac cgc aac atg gtc gtc gag 
G">n Gly Asp Trp Phe Leu His Lys Arg Asn Arg Asn Met Val Va^ Glu 
180 185 190 

ate gac acc gac ate gag gee gac gee gcg ttc cgc tgg ctg acc etc 
He Asp Thr Asp He Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr i,eu 
195 200 205 

gag cag ate cgc egg ctg atg etc cag gac gac etc gtc aac atg gac 
Gly Gin He Arg Arg Leu Met Leu Gin Asp Asp Leu Val Asn Met Asp 
210 215 220 

acc cgc agt gtg ctg gee tgt ctg ccc acc gcg cac ggc acg ccc gac 
Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp 
225 230 235 240 

gac agt gac gac tec ttc ccg gcg gcg ctg cgc cgc tec etc tac ggg 
Asp Gly Asp Asd Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly 
245 250 255 

aaa acc gcg ccg ttg cac gat ctg cac gee ate acc age tgc etc acc 
Glu Thr Ala Pro Leu His Asp Leu His Ala He Thr Ser Cys Leu Thr 
260 265 270 

gac ate cag gcg ctg egg gtg ctg cgc cag cag age gtg ccg etc gac 
a S p Val Ara Ala Leu Arg Val Leu Arg Gin Gin Ser Val Pro Leu Asp 
275 280 285 

aac acc egg cag gac ggc tgg gag egg acc ggg age gcg ate egg cat 
Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala He Arg His 
290 295 300 

cgc age ggc agg cat ttc gag ate atg gcg gtg gag gtg acc gcg gag 



240 



288 
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384 



432 



480 



528 
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672 



720 



768 



816 



864 



912 



960 
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Arg Ser Gly Arg His Phe Giu lie Met Ala Val Glu Val Thr Ala Glu 

305 " 310 315 320 

cgc cgt gaa gtg gcc teg tgg acc cag ccg ttg ctg cgc ccg tgc teg 

Arg Arg Giu Val Ala Ser Trp Thr Gin Pro Leu Leu Arg Pro Cys Ser 
325 330 335 



gcc ctg gtg gcg gcg egg teg gag gtc ggc acg etc aac gtc gee gag 
Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu 
355 360 365 



gca cac gcc tec tac tga 

Ala His Ala Ser Tyr 

465 470 



1008 



cag gga ctg gcg gcc ctg ate acc egg egg ate aac ggg gtg ctg cac 10b6 
Gin Gly Leu Ala Ala Leu lie Thr Arg Arg lie Asn Gly Val Leu His 
" 340 " 345 ' 350 



1104 



ttc gga ccg acc gtc cag tgc egg ccc gac gag gcg gac ggc cag teg 1152 

Phe Gly Pro Thr Val Gin Cys Arg Pro Asp Glu Ala Asp Gly Gin Ser 

370 375 380 

ccc ccg tac ctg gac egg gtg ctg acg gcc gga gcc gac cgc gtc cgc 1200 

Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val Arg 

385 390 395 400 

tac gac gtg gtg cag teg gag gag ggc ggg cgc ttc tac cac gcg cgc 

Tvr Asp Val Val Gin Ser Glu Glu Gly Gly Arg Phe Tyr Kis Ala Arg 

405 410 415 

aac cgc tat ctg gtg gtc gag gcg ggg ccg gag etc gac acg ggc tgc 

Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys 

420 425 430 

ccg ccc ggc ttc tgc tgg get acc ttc ggc cag etc ace gaa ctg etc 1344 

Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gin Leu Thr Glu Leu Leu 

435 440 445 

gcg cac ggc aac tat etc aac gtc gaa etc cgc acc etc atg gcg tgc 1392 

Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys 

450 455 460 



1248 



1296 



1410 



<210> 41 
<211> 469 
<212> PRT 

<213> Streptomyces amhofaeiens 
<400> 41 

Val Gly Thr Val Glu Tyr Ala Val His Arg Arg Thr Ala Glu Arg Val 
15 10 15 

Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala Glu 
20 25 30 

Val Pro Arg Trp Leu Giu Glu Tyr His Arg Ala His Arg Phe His Val 
35 40 45 



Glu Pro lie Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu .-to Gly 
50 55 60 
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Th- Glv Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Vai Glu Gly 
65 " " 70 75 80 

Leu Ar-g. Thr Ser Ser 'Asp Ala Asp Pro Val Ala Arg Val Gin Pro lie 
85 90 95 

11- Val Gin Pro Glu Val Gly Leu Leu Gly He Leu Ala Arg Glu Phe 
100 105 110 

Asp Gly Val Leu His Phe Leu Met Gin Ala Lys Pro Glu Pro Gly Asn 
" _ 115 120 125 

Val Asn Gly Leu Gin He Ser Pro Thr Val Gin Ala Thr Arg Ser Asn 
130 135 1^0 

Phe Asp Glu Val His His Gly Arg Ser Thr Pro Phe Leu Asp His Phe 
145 " 150 155 lt,u 

He His Ara Pro Gly Arg Arg Val Leu He Asp Ser He Gin Ser Glu 
165 170 175 

Gin Gly Asp Tro Phe Leu His Lys Arg Asn Arg Asn Met Val Val Glu 
180 185 190 

II- Asp ^hr ASP He Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr Leu 
195 200 205 

Gly Gin lie Arg Arg Leu Met Leu Gin Asp Asp Leu Val Asn Met Asp 
210 215 220 

Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro Asp 
225 " 230 235 240 

Asp Glv Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr Gly 
* 245 2 50 255 

Glu Thr Ma Pro Leu His Asp Leu His Ala He Thr Ser Cys Leu Thr 
260 265 270 

Asp Val Arg Ala Leu Arg Val Leu Arg Gin Gin Ser Val Pro Leu Asp 
275 280 285 

Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala He Arg His 
290 295 .. 300 

Arg Ser Gly Pro His Phe Glu He Met Ala Val Glu Val Thr Ala Glu 
305 ' 310 315 320 

Arg arc Glu Val Ala Ser Trp Thr Gin Pro Leu Leu Arg Pro Cys Ser 
325 330 335 

Gin Gly Leu Ala Ala Leu He Thr Arg Arg He Asn Gly Val Leu His 
340 345 350 

Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala Glu 
355 360 365 

r>he Gly o ro Thr Val Gin Cys Arg Pro Asp Glu Ala Asp Gly Gin Ser 
370 375 380 
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Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Giy Ala Asp Arg Val Arg 
385 390 395 400 

Tyr Asp Val Val Gin Ser Glu Glu Gly Gly Arg Phe Tyr His Ala Arg 
405 410 415 

Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly Cys 
420 425 430 

Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gin Leu Thr Glu Leu Leu 
435 440 445 

Ala Kis Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala Cys 
450 455 460 

Ala Kis Ala Ser Tyr 
465 



<210> 42 
<211> 454 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 42 

Val Arg Val Ser Ala Asp Thr Leu Asp Ser Pro Val Thr Ala Leu Ala 
15 10 15 

Glu Val Pro Arg Trp Leu Glu Glu Tyr Mis Arg Ala His Arg Phe Kis 
20 25 30 

Val Glu Pro lie Pro Phe Asp Arg Leu Arg Arg Trp Ser Phe Glu Pro 
35 40 45 

Gly Thr Gly Asp Leu Arg His Glu Thr Gly Arg Phe Phe Ser Val Glu 
50 55 60 

Gly Leu Arg Thr Ser Ser Asp Ala Asp Pro Val Ala Arg Val Gin Pro 
65 70 75 80 

lie lie Val Gin Pro Glu Val Gly Leu Leu Giy lie Leu Ala Arg Glu 
85 90 95 

Phe Asp Gly Val Leu His Phe Leu Met Gin Ala Lys Pro Glu Pro Gly 
100 105 110 

Asn Val Asn Gly Leu Gin lie Ser Pro Thr Val Gin Ala Thr Arg Ser 
115 120 125 

Asn Phe Asp Glu Val Kis Kis Gly Arg Ser Thr Pro Phe Leu Asp His 
130 135 140 

Phe lie His Arg Pro Gly Arg Arg Val Leu lie Asp Ser lie Gin Ser 
1^5 150 155 160 

Glu Gin Gly Asp Tro Phe Leu His Lys Arg Asn Arg Asn Met Val Val 
165 170 175 

Glu He Asp Thr Asp lie Glu Ala Asp Ala Ala Phe Arg Trp Leu Thr 
180 185 190 
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Leu Gly Gin lie Arg Arg Leu Met Leu Gin Asp Asp Leu Val Asn Met 
195 200 205 

Asp Thr Arg Ser Val Leu Ala Cys Leu Pro Thr Ala His Gly Thr Pro 
210. 215 220 

Asp Asp Gly Asp Asp Ser Phe Pro Ala Ala Leu Arg Arg Ser Leu Tyr 
225 ~ ^ 230 235 240 

Glv Glu Ala Pro Leu His Asp Leu His Ala lie Thr Ser Cys Leu 

245 250 255 

Th- Asp Val Arg Ala Leu Arg Val Leu Arg Gin Gin Ser Val Pro Leu 
260 265 270 

Asp Asp Ala Arg Arg Asp Gly Trp Glu Arg Thr Gly Ser Ala He Arg 
275 280 285 

His Ar-g Ser Gly Arg His Phe Glu He Met Ala Val Glu Val Thr Ala 
290 295 300 

G^u £rg Arg Glu Val Ala Ser Trp Thr Gin Pro Leu Leu Arg Pro Cys 
305 ~ 310 315 320 

Ser Gin Gly Leu Ala Ala Leu He Thr Arg Arg He Asn Gly Val Leu 
325 330 335 

Pis Ala Leu Val Ala Ala Arg Ser Glu Val Gly Thr Leu Asn Val Ala 
340 345 350 

Glu Phe Gly Pro Thr Val Gin Cys Arg Pro Asp Glu Ala Asp Gly Gin 

355 360 . 365 

Ser Pro Pro Tyr Leu Asp Arg Val Leu Thr Ala Gly Ala Asp Arg Val 
370 375 380 

Arq Tyr Asp Val Val Gin Ser Glu Glu Gly Gly Arg Phe Tyr His Ala 
385 390 395 400 

Ar-a Asn Arg Tyr Leu Val Val Glu Ala Gly Pro Glu Leu Asp Thr Gly 
405 410 415 

Cvs Pro Pro Gly Phe Cys Trp Ala Thr Phe Gly Gin Leu Thr Glu Leu 
42 0 42 5 43 0 

Leu Ala His Gly Asn Tyr Leu Asn Val Glu Leu Arg Thr Leu Met Ala 
435 440 445 

Cys Ala His Ala Ser Tyr 
450 



<210> 43 
<211> 1248 
<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1243) 
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<400> 43 

atg ccg ggc ggg acg gac ggc gac tgc gcg egg acg gcg gec egg cgt 

Met Pro Glv Gly Thr Asp Gly Asp Cvs Ala Arg Thr Ala Ala Arg Arg 
15 10 15 

cga acg cac ctg ccc gag tec gga cga gac age gcg acg cga gag gcg 
Arg Thr His Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala 

. .2.0 - 25. _ _ .... _ 30... 

aaa atg ate aat etc ttc cag ccc cag atg ggg- gec gag gaa ctg gcg 
Lys Met lie Asn Leu Phe Gin Pro Gin Met Gly Ala Glu Glu Leu Ala 
35 40 45 



ccg gtg ttc tgc gac ace gac ccg egg acg ctg aac ccc gee ctg gag 
Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu 
13 0 ^ 13 5 140 



tgg age ttc gac gec atg aag gtc ctg gtc acc ggc gac gga ggg atg 
Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met 
210 215 220 



48 



96 



144 



gcg gtg tec gag gtc ttc gac gac caa tgg etc ggt cac gga ccc egg 192 

Ala Val Ser Glu Val Phe Asp Asp Gin Trp Leu Gly His Gly Pro Arg 
50 55 60 

acc gcg gcg ttc gag tec gcg ttc gee gag cac etc ggg gtc ggc ccc 2 40 

Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu His Leu Gly Val Gly Pro 
65 70 75 80 

gag cac gtc gtc ttc etc aac teg ggc acc gec ggc etc ttc ctg .gec 

Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala 
85 90 95 

ctg gag teg etc ggc ctg egg ccc ggc gac gag gtc gtg etc ccc teg 

Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu Val Val Leu Pro Ser 

100 105 110 

ccc age ttc etc gee gcg gcg aac gec gta cag etc teg gga gcg cgc 384 

Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gin Leu Ser Gly Ala Arg 
115 120 125 



288 



336 



432 



cac ate gag gcg gee gtc acc ccg cgc acc agg gee gtc ate gcg etc 480 

Kis He Glu Ala Ala Val Thr Pro Arg Thr Arg Ala Val He Ala Leu 
145 150 155 160 

cac tac ggc ggc cac ccc ggc gac ate gtg cgc ate gee gag cgc tgc 52 8 

His Tyr Gly Gly His Pro Gly Asp He Val Arg He Ala Glu Arg Cys 
165 170 175 

egg gag egg ggc ate acc ctg ate gag gac gee gcg tgc tec gtg gee 57 6 

Arg Glu Arg Gly He Thr Leu He Glu Asp Ala Ala Cys Ser Val Ala 

180 185 190 

tec cgc gtc gac ggc cga ccg gtc ggc acc ttc ggc gac etc gee atg 624 

Ser Arg Val A.sp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu A_la Met 

195 200 205 



672 



ate tac gtc aag gac ccc ggg gcg gec gee egg ate egg cgc etc gec 720 
He Tyr Val Lys Asp Pro Gly Ala .Ala Ala Arg He Arg Arg Leu Ala 
225 230 235 240 



* 

I 
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816 



864 



912 



960 



1008 



1056 



1104 



ta-- cac age etc acg egg tec age ggc ctg gga tac gee agg gtc teg 7 68 
<rv^ "is Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser 
245 ~ 250 255 

gcg cgc tgg tgg gag atg gac gtc ccc gaa ccg ggc cgc cgc gtc ate 
*la Arg Tro Trp Glu Met Aso Val Pro Glu Pro Gly Arg Arg Val lis 
260 265 270 

ggg aac gac etc ace gcg gee ate ggc gcg gtc cag ttg cgc egg ctt 
Gly Asn Asv Leu Thr Ala Ala He Gly Ala Val Gin Leu Arg Arg Leu 
275 280 285 

ecc ggc ttc gtg gee cgc cgc agg gag ate gtc gee ctg tac gac age 
Pro Glv Phe Val Ala Arg Arg Arg Glu He Val Ala Leu Tyr Asp Ser 
290 295 300 

gaa ctg age teg ctg gag ggc gtg ctg aca ccg ccc gcg cca ccc gcg 
Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala 
305 310 315 320 

ggg cac gag tec acg cac tac ttc tac tgg ate cag ctg gee ccc ggc 
GTy His Glu Ser Thr His Tyr Phe Tyr Trp He Gin Leu Ala Pro Gly 
325 330 335 

gtc egg aac egg gtg gca cgc gac ctg etc ace gac ggc ate tac ace 
Val *rg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly He Tyr Thr 
340 345 350 

ace ttc cgc tac gca cct ctg cac aag gtg ccc gee tac ggc cac ace 
Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr 
355 360 365 

gga gac gaa ctg ccc ggc gtg gag egg gcg tec gaa egg ace ctg tgc 1152 
Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys 
370 375 380 

ctg ccc ctg cac ccc ggc ctg teg gac gee gac gtc cgc ace gtc gtg 
Leu Pro Leu His Pro Gly Leu Ser Asp Ala Asp Val Arg Thr Val Val 
385 * 390 395 400 

tec tec ctg cgc aga gec ctg age gee gcg gat ccg gee ccc gee tga 
Ser Ser Leu hrg *-rg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala 
AQ5 410 415 



<210> 44 
<211> 415 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 44 

Met =ro Gly Gly Thr Asp Gly Asp Cys Ala Arg Thr Ala Ala Arg Arg 
1 5 10 15 

a-g -r-hr Pis Leu Pro Glu Ser Gly Arg Asp Ser Ala Thr Arg Glu Ala 
20 25 30 

Lvs Met He hsn Leu Phe Gin Pro Gin Met Gly Ala Glu Glu Leu Ala 
35 40 45 



1200 



1248 
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Ala Val Ser Glu Val Phe Asp Asp Gin Trp Leu Gly Kis Gly Pro Arg 
50 55 60 

Thr Ala Ala Phe Glu Ser Ala Phe Ala Glu Kis Leu Gly Val Gly Pro 

65 70 75 80 

Glu His Val Val Phe Leu Asn Ser Gly Thr Ala Gly Leu Phe Leu Ala 

85 90 95 



Leu Glu Ser Leu Gly Leu Arg Pro Gly Asp Glu VaT Val Leu Pro Ser 
100 105 HO 

Pro Ser Phe Leu Ala Ala Ala Asn Ala Val Gin Leu Ser Gly Ala Arg 
115 120 125 

Pro Val Phe Cys Asp Thr Asp Pro Arg Thr Leu Asn Pro Ala Leu Glu 
130 135 140 

His lie Glu Ala Ala Val . Thr Pro Arg Thr Arg Ala Val lie Ala Leu 
145 150 155 160 

His Tvr Glv Gly His Pro Gly Asp lie Val Arg lie Ala Glu Arg Cys 
165 170 175 

Arg Glu Arg Gly lie Thr Leu lie Glu Asp Ala Ala Cys Ser Val Ala 
180 185 190 

Ser Arg Val Asp Gly Arg Pro Val Gly Thr Phe Gly Asp Leu Ala Met 
195 200 205 

Trp Ser Phe Asp Ala Met Lys Val Leu Val Thr Gly Asp Gly Gly Met 
210 215 220 

lie Tyr Val Lys Asp Pro Gly Ala Ala Ala Arg lie Arg Arg Leu Ala 
225 . 230 235 240 

Tyr His Gly Leu Thr Arg Ser Ser Gly Leu Gly Tyr Ala Arg Val Ser 
245 250 255 

Ala Arg Trp Trp Glu Met Asp Val Pro Glu Pro Gly Arg Arg Val He 
260 265 270 

Gly Asn Asp Leu Thr Ala Ala He Gly Ala Val Gin Leu Arg Arg Leu 
275 280 285 

Pro Gly Phe Val Ala Arg Arg Arg Glu He Val Ala Leu Tyr Asp Ser 
290 295 300 

Glu Leu Ser Ser Leu Glu Gly Val Leu Thr Pro Pro Ala Pro Pro Ala 
305 310 ' • 315 320 

Gly His Glu Ser Thr His Tyr Phe Tyr Trp He Gin Leu Ala Pro Gly 
325 330 335 

Val Arg Asp Arg Val Ala Arg Asp Leu Leu Thr Asp Gly He Tyr Thr 
340 345 350 

Thr Phe Arg Tyr Ala Pro Leu His Lys Val Pro Ala Tyr Gly His Thr 
355 360 365 

Gly Gly Glu Leu Pro Gly Val Glu Arg Ala Ser Glu Arg Thr Leu Cys 
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370 375 380 

L^u Leu His Pro Glv Leu Ser Asp Ala Asp Val Arg Thr Val Val 

385 390 395 400 

S^ r q Dr Leu Arg Arg Ala Leu Ser Ala Ala Asp Pro Ala Pro Ala 
405 410 415 



<210> 45 
<211> 720 
<212> ADK 

< 2 1 3 > Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> {1) . . (720) 

atg°tac D gag aac gac agt gcc gcc gag gtc tac gac ctg etc tac cag 48 
Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gin 
1 5 10 15 

gac cgc aag gac tac gcg ggt gag gcc gcc egg gtc acc gac ctg ate 9 6 
Asp Arg Lys Asp Tyr Ala Giy Glu Ala Ala Arg Val Thr Asp Leu He 
20 25 30 

cag gaa cgt acg ccg gac gcg gcc age ctg etc gac ate gcg tgc ggc 144 
arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp He Ala Cys Gly 
35 40 45 

acc agt acc cac ctg gag gcc ttc gcc aag etc tac gac cgc gtg age 
Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser 
50 55 60 

gac ctg gag ctg tec gag tgg atg gcg gcc cgc gcc gag gag egg etc 
Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu 
65 70 75 80 

ccc gac gtc acc etc cac cgc ggt gac atg egg gcg ttc gac etc ggc 
Dro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly 
85 90 95 

gag aca ttc gac gcc gtg gtc tgc atg t£c age teg ate ggg tac ctg 
Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser He Gly Tyr Leu 
100 105 HO 

gaa acc acg gcc gac ctg gag gac gcc gtc gcc gcc atg gcg egg cac 
Glu Thr Thr *la Asp Leu Glu Aso Ala Val Ala Ala Met Ala Arg His 
115 120 125 

ctg acc gcg gac ggt gtc ctg gcc gtc gaa ccg tgg tac ttc ccc gac 
Leu Thr Ala Aso Glv Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp 
130 135 140 

acc ttc ctg gac ggc cac gtc tec acc cac gcc ctg egg acg gca ccg 
Tb^ *he Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro 
145 150 155 160 

ggc gac cag ggc gtc gcc cgt gtc tec cac teg acc egg gag ggc ggg 



192 



240 



288 



336 



384 



432 



480 



528 
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Gly Asp Gin Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly 

165 170 175 

egg acc egg atg gag ate cac tad ctg ate gcg eac ace gcg gag ggc 57 6 

Arg Thr Arg Met Glu lie His Tyr Leu lie Ala His Thr Ala Glu Gly 
180 185 190 

ate egg eac cgc age gag gtg gac tac cte acg ctg ttc teg cgt gcg 624 

lie Arg His Arg Ser Glu Val Asp Tyr Leu Thr Leu Phe S er Arg Ala _ 

195 ~ ' 200 ~ ' 205 

gag tac gag gee gcg tac cgc aag gee ggc ctg gac gtc gag tac gtc 672 

Glu Tyr Glu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val 
210 215 220 



gtg acg ggc gag ggc tea ecg ggc ttc ttc etc ggc acg cgt cgc tga 
Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg 
225 230 235 240 



720 



<210> 46 

<211> 239 

<212> PET : ..... . 

<2 13 > Strep tomyces ambof aciens 

<400> 46 

Met Tyr Glu Asn Asp Ser Ala Ala Glu Val Tyr Asp Leu Leu Tyr Gin 
1 " 5 10 15 

Asp Arg Lys Asp Tyr Ala Gly Glu Ala Ala Arg Val Thr Asp Leu lie 
20 25 30 

Arg Glu Arg Thr Pro Asp Ala Ala Ser Leu Leu Asp lie Ala Cys Gly 
35 40 45 

Thr Gly Thr His Leu Glu Ala Phe Ala Lys Leu Tyr Asp Arg Val Ser 
50 55 60 

Gly Leu Glu Leu Ser Glu Trp Met Ala Ala Arg Ala Glu Glu Arg Leu 
65 70 75 80 

Pro Gly Val Thr Leu His Arg Gly Asp Met Arg Ala Phe Asp Leu Gly 
85 90 95 

Glu Thr Phe Asp Ala Val Val Cys Met Phe Ser Ser lie Gly Tyr Leu 
100 105 110 

Glu Thr Thr Ala Asp Leu Glu Asp Ala Val Ala Ala Met Ala Arg His 
115 120 ' 125 

Leu Thr Ala Asp Gly Val Leu Ala Val Glu Pro Trp Tyr Phe Pro Asp 
130 135 140 

Thr Phe Leu Asp Gly His Val Ser Thr His Ala Leu Arg Thr Ala Pro 
145 150 155 160 

Gly Asp Gin Gly Val Ala Arg Val Ser His Ser Thr Arg Glu Gly Gly 
165 170 175 

Arg Thr Arg Met Glu lie His Tyr Leu He Ala His Thr Ala Glu Gly 
180 185 190 



1er depot 

70 



lie Arg His Arg Ser GIu Val Asp Tyr Leu Thr Leu Phe Ser Arc Ala 
195 200 205 

Glu Tyr GIu Ala Ala Tyr Arg Lys Ala Gly Leu Asp Val Glu Tyr Val 
210 215 220 

Val Thr Gly Glu Gly Ser Pro Gly Phe Phe Leu Gly Thr Arg Arg 
225 230 235 



<210> 47 
<211> 1968 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1968) 



<400> 47 

atg agt gac ctg ggt tct ggt gaa gaa ggg tec gaa gaa gac gag teg 

Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser 

1 " 5 10 15 

gac gac gca etc gec ttc etc gag ttc ate gee egg teg gca cca egg 

Asp Asp Ala Leu Ala Phe Leu Glu Phe lie Ala Arg Ser Ala Pro Arg 

20 25 30 

aac gaa tac gac egg etc atg gec cgc gec gaa cgc teg ggc gee gac 

Ser Glu Tyr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp 

35 40 45 

gag gac egg atg cgc cga ctg gag cgc ttc aac egg etc gec etc ace 132 

Glu Asp Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr 
50 - 55 60 



gcg cag teg atg ate gag tac cgc cgc gac egg gag gcg gag etc gcg 

Ala Gin Ser Met lie Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala 

65 70 75 80 

gec ctg gtc gac gec gcg cac gag ttc gtc gec gee egg egg ggc aag 

Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys 
85 90 95 

gac ctg ctg gag tec ate gec cgc aga gca egg ctg ctg ctg aag ctg 

Asp Leu Leu Glu Ser lie Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu 
100 105 110 

gac gtc tec tac gtc ggc ctg cac gag gag gac egg ccc ggc acg gtg 

Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val 
115 120 125 

gtg ctg age gec gac ggc aac gcg gtc aag gtc gec gag age tac egg 

Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg 
130 135 140 

ctg ccg gec gac ggc gga ctg ggc gec atg gtg cgc acc tgc cgc get 
Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala 

145 150 155 1^0 



48 



96 



1 L A 



240 



288 



336 



384 



432 



480 
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ccc ttc tgg acc ccg gac tac etc ggg gac aac age ttc acg cac ate 528 
Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr Mis Val 
165 170 175 

gag gec gtc gac gac ate gtc cgc gec gaa ggc ctg cgc gcg gtc ctg 57 6 
Glu Ala Val Asp Asp lie Val Arg Ala Glu Gly Leu Arg Ala Val Leu 
180 185 ISO 

gee gtc ccg ctg tgc gee ggg ggc gaa ccg atg ggg gtc etc tac gtc 62 4 
Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tvr Val 
155 200 205 

gee gac cgt cag gtg egg cat ctg acc ccc aac gag gtc acc ctg ctg 67 2 
Ala Asp Arg Gin Val Arg His Leu Thr Pro Asn Glu Val Thr Leu Leu 
210 215 220 

tgc teg etc gec gat ctg gee gcg gtg gcg ate gag cgc aac egg ctg 72 0 
Cys Ser Leu Ala Asp Leu Ala Ala Val Ala lie Glu Ara Asn Arg Leu 
225 230 235 240 

gtc gag gag etc cac gac acc ate ggg caa ctg cgc cag gac ate ggc 76 8 
Val Glu Glu Leu His Asp Thr He Gly Gin Leu Arg Gin Asp He Gly 
245 250 255 

gag gec cgc acc gee etc gcg cgc acc cgc agg tec gec gac etc cag 816 
Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gin 
260 265 270 

teg cac ctg gtc acg cag gtg atg gac agg cgc ggc gee gac teg tta 864 
Ser His Leu Val Thr Gin Val Met Asp Arg Arg Gly Ala Asp Ser Leu 
275 280 285 

etc gcg acg gec gec gag gcg etc ggc ggc gga gee ggc ctg tgc age 912 
Leu Ala Thr Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cvs Ser 
290 295 300 

ccg etc ggg cgc ccg etc gec gag tac ggg acc ctg cgc ccc gtc gee 960 
Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Ara Pro Val Ala 
305 310 315 320 

ccc acg gaa ctg cgc gcg gcg tgc cgc egg gec gec gag acc ggc egg 10 08 
Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg 
325 330 335 

ccc acc tec gtg gee ccg ggg gtc tgg acg gtg ccc ctg ctt ccc agg 1056 
Pro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly 
340 345 350 

ggc aac gee ggc ttc ctg ctg acc gac etc ggt ccg gac gcg gac cac 1104 
Gly Asn Ala Gly Phe Leu Leu Thr -Asp Leu Gly Pro Asp Ala Aso His 
355 360 365 

acc gec gtc ccc ctg etc ccg atg gtc gee cgc acc etc gcg ctg cac 1152 
Thr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His 
370 375 380 

ctg cgc gtc cag cac gac gac tec ccc aag gcg cag age cac cag gag 1200 
Leu Arg Val Gin His Asp Asp Ser Pro Lys Ala Gin Ser His Gin Glu 
385 390 395 400 
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gac ggc ggc acc gcg tgc gcc tec gac ctg ggt ttc etc ggc atg etc 
*sp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu 
530 535 540 

etc gcc gag gag aac gac gtc ccc ggt tac ate agg acg acg ate ggc 
Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr He Arg Thr Thr He Gly 
545 . 550 555 560 

ccc atg gtc gac tac gac acc cac cgc ttc acg gat ctg gtt ccc act 
o ro val Val Asp Tyr Asd Thr His Arg Phe Thr Asp Leu Val Pro Thr 
565 570 575 

ctg agg gtg tac ctg gag teg ggc agg age ccc acg cgt gcc gca gag 
Leu A-g Val Tyr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu 
580 585 590 

aca ctg cgc gtg cac ccg aac acc gtc tea egg egg ctg gag cgc ate 
Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg He 
595 600 605 

aac gta ctg ctg gga gag gac tag cag tea ccg gag egg gtg ctg gac 
Gly Val Leu Leu Gly Glu Asp Trp Gin Ser Pro Glu Arg Val Leu Asp 
610 615 620 

ata caa ctg gcc ctg egg etc tat cag gtg cgc teg gcg etc tec teg 
Il~ Gin Leu Ala Leu Arg Leu Tyr Gin Val Arg Ser Ala Leu Ser Ser 
625 630 635 640 

caa ccg gcg tec gag acc egg gcc gtg etc gga teg ctg cgc gag tga 



1296 



1344 



ttc ttc gac gac ctg ate ggg gcg ccc cgc tea ccc acg etc etc agg 
Phe Phe Aso Asr> Leu He Glv Ala Pro Arg Ser Pro Thr Leu Leu Arg 
405 410 41d 

gaa cgc gcc ctg atg ttc tec etc age ttc cgc cgc ccg cac gtg gtg 
Glu Arc Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val 
420 425 430 

eta gtg gcg gac gaa ccc cgc ggg acc teg ccg egg ctg gag gcc tec 
Leu Val Ala Asp Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser 
435 440 445 

age gcc gac tac gcg aag gag etc ggc ggg ctg tgc age gtg egg gac 1392 
Gly Ala Asp ^yr Ala Lvs Glu Leu Gly Gly Leu Cys Ser Val Arg Asp 
450 455 460 

ggc gcc gtc gtc ctg ctg ctg ccc ggc gac gac ccc gtc gcc gtg gcg 1440 
Glv Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala 
465 " ~ 470 475 480 

caa acc gcc gcc ccg gag ctg acc gac cgc gcc ggg cac ccc gtc acc 14 88 
Gin Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr 
485 490 495 

gtg ggg gtc gcg ggc ccc gcc teg acc gtc gac ggc ate gcc gac gcg 
Val Gly Val Ala Gly Pro Ala Ser Thr Val Asp Gly He Ala Asp Ala 
500 505 510 

cac cgt gag gcc gcg aag tgt ctg gag acc etc cgc gcg etc ggc ggc 15 84 
Hi s A-g Glu Ala Ala Lys Cvs Leu Glu Thr Leu Arg Ala Leu Gly Gly 
515 520 525 



1536 
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1680 



1728 



1776 
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1872 



1920 
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GIp ^ro Ua Ser Glu Thr Arg Ala Val Leu Gly Ser Leu Arg Glu 
645 650 655 



<210> 48 
<2I1> 655 
<212> ?RT 

<2I3> Streptomyces ambofaciens 

~<400>~ 48 " 
Met Ser Asp Leu Gly Ser Gly Glu Glu Gly Ser Glu Glu Asp Glu Ser 
! 5 10 15 

Asp Asp Ala Leu Ala Phe Leu Glu Phe lie Ala Arg Ser Ala Pro Arg 
20 25 30 

Ser Glu Tvr Asp Arg Leu Met Ala Arg Ala Glu Arg Ser Gly Ala Asp 
35 40 45 

Glu Aso Arg Met Arg Arg Leu Glu Arg Phe Asn Arg Leu Ala Leu Thr 
50 ~ 55 60 

Ala Gin Ser Met He Glu Tyr Arg Arg Asp Arg Glu Ala Glu Leu Ala 
65 70 75 80 

Ala Leu Val Asp Ala Ala His Glu Phe Val Ala Ala Arg Arg Gly Lys 
85 90 95 

Aso Leu Leu Glu Ser He Ala Arg Arg Ala Arg Leu Leu Leu Lys Leu 
100 105 HO 

Asp Val Ser Tyr Val Gly Leu His Glu Glu Asp Arg Pro Gly Thr Val 
115 12 0 12 5 

Val Leu Ser Ala Asp Gly Asn Ala Val Lys Val Ala Glu Ser Tyr Arg 
130 135 140 

Leu Pro Ala Asp Gly Gly Leu Gly Ala Met Val Arg Thr Cys Arg Ala 
145 150 155 160 

Pro Phe Trp Thr Pro Asp Tyr Leu Gly Asp Asn Ser Phe Thr His Val 
165 170 175 

Glu Ala Val Aso Aso He Val Arg Ala Glu Gly Leu Arg Ala Val Leu 
180 185 190 

Ala Val Pro Leu Cys Ala Gly Gly Glu Pro Met Gly Val Leu Tyr Val 
195 200 205 

Ala Aso Arg Gin Val Arg Kis Leu Thr Pro Asn Glu Val Thr Leu Leu 
210 215 220 

Cvs Ser Leu Ala Asp Leu Ala Ala Val Ala He Glu Arg Asn Arg Leu 
225 230 235 240 

Val Glu Glu Leu His Asp Thr lie Gly Gin Leu Arg Gin Asp He Gly 
245 250 255 



Glu Ala Arg Thr Ala Leu Ala Arg Thr Arg Arg Ser Ala Asp Leu Gin 
260 265 270 
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Ser His Leu Val Thr Gin Val Met Asp Arg Arg Gly Ala Asp Ser Leu 
275 280 285 

Leu Ala Th^ Ala Ala Glu Ala Leu Gly Gly Gly Ala Gly Leu Cys Ser 
290. 295 300 

Pro Leu Gly Arg Pro Leu Ala Glu Tyr Gly Thr Leu Arg Pro Val Ala 
305 ' 310 315 320 

Pro Thr Glu Leu Arg Ala Ala Cys Arg Arg Ala Ala Glu Thr Gly Arg 
325 330 33d 

p ro Thr Ser Val Ala Pro Gly Val Trp Thr Val Pro Leu Leu Pro Gly 
340 345 3d0 

Gly Asn Ala Gly Phe Leu Leu Thr Asp Leu Gly Pro Asp Ala Asp His 
355 360 365 

■^hr Ala Val Pro Leu Leu Pro Met Val Ala Arg Thr Leu Ala Leu His 
370 375 380 

Leu A-g Val Gin His Asp Asp Ser Pro Lys Ala Gin Ser His Gin Glu 
385 390 395 400 

ohe Phe Asp Asp Leu He Gly Ala Pro Arg Ser Pro Thr Leu Leu Arg 
405 410 415 

Glu Arg Ala Leu Met Phe Ser Leu Ser Phe Arg Arg Pro His Val Val 
420 425 430 

Leu Val Ala Aso Gly Pro Arg Gly Thr Ser Pro Arg Leu Glu Ala Ser 
435 440 445 

Gly Ala Asp Tyr Ala Lvs Glu Leu Gly Gly Leu Cys. Ser Val Arg Asp 
450 455 460 

Glv Ala Val Val Leu Leu Leu Pro Gly Asp Asp Pro Val Ala Val Ala 
465 470 475 480 

Gin Thr Ala Ala Pro Glu Leu Thr Asp Arg Ala Gly His Pro Val Thr 
485 . 490 495 

Val Gly Val Ala Glv Pro Ala Ser Thr Val Asp Gly He Ala Asp Ala 
500 505 510 

His Arg Glu Ala Ala Lvs Cys Leu Glu Thr Leu Arg Ala Leu Gly Gly 
515 520 525 

Asp Gly Gly Thr Ala Cys Ala Ser Asp Leu Gly Phe Leu Gly Met Leu 
530 " 535 540 

Leu Ala Glu Glu Asn Asp Val Pro Gly Tyr He Arg Thr Thr He Gly 
545 550 555 560 

=ro Val Val Asp Tyr Asp Thr His Arg Phe Thr Asp Leu Val Pro Thr 
565 570 575 

Leu Arg Val Tvr Leu Glu Ser Gly Arg Ser Pro Thr Arg Ala Ala Glu 
5 80 5 85 59 0 

Thr Leu Arg Val His Pro Asn Thr Val Ser Arg Arg Leu Glu Arg He 
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o95 600 605 

Gly Val Leu Leu Gly Glu Asp Trp Gin Ser Pre Glu Arg Val Leu Asp 
610 615 620 

lie Gin Leu Ala Leu Arg Leu Tyr Gin Val Arg Ser Ala Leu Ser Ser 
625 630 635 640 

G in P ro Ala Ser Glu Thr Ar c ? Ala Val _ Leu_Gl v_ Ser Leu_Arg Glu 



645 650 655 



<210> 49 
<211> 174S 
<212> ADN 

<213> Streptomyces ambof aciens 



<220> 

<221> CDS 

<222> (1) . . (1749) 



<220> 

<221> CDS 

<222> (76) . . (1749) 



<220> 

<221> CDS 

<222> (97) . . (1749) 

<400> 49 

atg tec gca gtg gtg gcg tec ctt ctg ctt tec gtt ctt tct gcg age 48 

Met Ser Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser 
15 10 15 



gcg etc acg cat cca etc ate etc ate gtg gaa aca gga gac tta cgc 9 6 
Ala Leu Thr His Pro Leu lie Leu lie Val Glu Thr Gly Asp Leu Arg 
20 25 30 



gtg teg att gcg caa tac gee eta cac gac ate acg aag cgc tac cac 144 

Val Ser lie Ala Gin Tyr Ala Leu His Asp lie Thr Lys Arg Tyr His 
35 40 45 

gac cgt gtc gtg etc gac egg gtc ggt ttc age ate aag ccg ggc gag 192 

Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser lie Lys Pro Gly Glu 
50 55 60 

aag gtc ggc gtg ate ggc gac aac ggt tec ggc aag tec acg ctg etc 240 

Lys Val Gly Val lie Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 
65 70 75 80 

aag ate etc gec ggc cgc gtg gag ccc gac aac ggc gcg etc ace gtg 2 88 

Lys lie Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 
85 90 95 



gtc get ccc ggc ggc gtc ggc tac ctg gcg cag aca ctg gaa ctg ccc 33 6 
Val Ala Pro Gly Gly Val Gly Tyr Leu Ala Gin Thr Leu Glu Leu Pro 
. 100 105 110 

etc gac gec acc gtc cag gac gec gtc gac ctg gee ctg tec gac ctg 3 84 
Leu Asp Ala Thr Val Gin Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 
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115 120 125 

cgc gag etc gaa gcg gcg atg cgc gag gec gag gcg gag ctg ggc gag 432 
Ara Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 
130. 135 140 

aac aac gag aac ggc tec gag cgc gag ctg tec gee ggc etc cag cgc 4 80 
S or A st> Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gin Arg 
145' " 150 155 160 

tac acc get ctg ate gag cag tac cag gcg cgt ggc ggc tac gag gee 52 8 
Tyr Ala Ala Leu Val Glu Gin Tyr Gin Ala Arg Gly Gly Tyr Glu Ala 
165 170 175 

aac atg cac gtg gag gtc gcg ctg cac ggc etc gga ctg ccg age ctg 
Asd Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 
180 185 190 

gac cgc gac cgc aag etc gga acc etc tec ggt ggc gaa cgc tec cgc 
Asp *rg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 
195 200 205 

etc acg etc gec gcg acc etc gee teg teg ccg gag ctg ctg etc ctg 
Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 
210 215 220 

gac gaa ccg acc aac gac etc gac gac egg gcg atg gaa tgg ctg gag 
Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 
225 ~ 230 235 240 

gac cac ctg gee ggc cac cgc ggc acg gtg ate gcg gtc acc cac gac 
z^sp Fis Leu Ala Gly Kis Arg Gly Thr Val lie Ala Val Thr His Asp 
245 250 255 

cag gtc ttc etc gac egg etc acc acc acg ate ctg gag gtc gac tec 
Arg Val ?he Leu Asp Arg Leu Thr Thr Thr He Leu Glu Val Asp Ser 
260 265 270 

aac aac gtc acc cgc tac ggc aac ggc tac gag ggc tac ctg acg gee 
Glv Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 
275 280 285 

aag gee gtg gaa cgc gag egg egg ctg egg gag tac gag gag tgg cgt 
Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 
290 295 300 

gec gaa etc gac cgc aac cgc ggg ctg ate acc tec aac gtg gcg egg 
Ala Glu Leu Asp Arg Asn Arg Gly Leu He Thr Ser Asn Val Ala Arg 
305 310 315 320 

atg gac ggc ate ccg cgc aag atg tec etc tec gtg ttc ggc cac ggc 
Met Asp Gly He Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 
325 330 . 335 

gec tac cgc agg cga ggg cgc gac cac ggc gcg atg gtg egg ate cgc 
Ala Tyr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg He Arg 
340 345 350 

aac gcg aag caa cgc gtg gcg cag ctg acc gag aac ccg gtc cac get 1104 
Asn Ala Lys Gin Arg Val Ala Gin Leu Thr Glu Asn Pro Val His Ala 
355 360 365 



576 



624 



672 



720 



768 



816 



864 



912 



960 



l008 



1056 
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ccc gcc gac ccg ttg tec etc gec gec cgc ate gac acc gcg ggc ccg 1152 

Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg lie Asp Thr Ala Gly Pro 

370 375 380 

gag gcg gag gag gcg gtg gcc gaa etc acc gac gtg cgc gtc gcg ggt 12 00 

Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 
385 390 395 400 



egg etc gcc gtg gac tec ctg acg ate egg ccc ggc gaa egg ctg etc 1248 
Arg Leu Ala Val Asp Ser Leu Thr lie Arg Pro Gly Glu. Arg Leu Leu 
405 410 415 

gtc aca ggt ccc aac ggt gcg ggc aag tec acc ttg ttg egg gtg ctg 12 96 
Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 
420 425 430 

tec ggg gaa ctg gag ccg gac ggc ggc teg gtg cgc gtc ggc tgc egg 1344 
Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 
435 440 445 

gtc ggt cat ctg egg cag gac gag acg ccc tgg gcg ccc gga ctg acc 13 92 
Val Gly His Leu Arg Gin Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 
450 455 460 

gtg ctg egg gcc ttc gcc cag ggc egg gag ggc tac ctg gag gac cac 1440 
Val Leu Arg Ala Phe Ala Gin Gly Arg Glu Gly Tyr Leu Glu Asp His 
465 470 475 480 

gcg gag aaa ctg ctg teg etc ggc ctg ttc age ccg tec gac ctg egg 1488 
Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 
485 490 495 

cga cgc gtg aag gat ctg tec tac ggg cag cgc cgc egg ate gag ate 153 6 
Arg Arg Val Lys Asp Leu Ser Tyr Gly Gin Arg Arg Arg lie Glu lie 
500 505 510 

gcc egg ctg gtg age gac ccg atg gac ctg ctg ctg ctg gac gag ccc 1584 
Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Asp Glu Pro 
515 520 525 

acc aac cac etc acc ccg gtg ctg gtg gag gag ttg gag cag gca etc 163 2 
Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gin Ala Leu 
530 535 540 

gcg gac tac cgc ggc gcc gtc gtg gtc gtc acc cac gac cgt egg atg 1680 
Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 
545 550 555 560 

egg tec egg tec acc ggc gcc egg ctg acc atg gga gac ggg cgc ate 172 8 
Arg Ser Arg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg lie 
565 570 575 

gcc gag ttc age gcc ggc tga 1749 
Ala Glu Phe Ser Ala Gly 
580 



<210> 50 
<211> 582 
<212> PRT 
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<213> Streptomyces ambof aciens 



Met°s«°Ala Val Val Ala Ser Leu Leu Leu Ser Val Leu Ser Ala Ser 
1 



5 10 15 



ala Leu Thr His Pro Leu He Leu He Val Glu Thr Gly Asp Leu Arg 
20 25 30 

Val Ser He Ala Gin Tyr Ala Leu His Asp He Thr Lys Arg Tyr His 
35 40 45 

Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser He Lys Pro Gly Glu 
50 55 60 

Lys Val Gly Val He Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 
65 70 75 80 

Lvs He Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 
85 90 95 

Val Ala Pro Glv Glv Val Gly Tyr Leu Ala Gin Thr Leu Glu Leu Pro 
100 105 HO 

L^u Asp Ala Thr Val Gin Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 
115 120 125 

Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 
130 135 140 

Ser Asp Glu Asn Gly Ser Glu Arg Glu Leu Ser Ala Gly Leu Gin Arg 
145 150 155 160 

Tyr Ala Ala Leu Val Glu Gin Tyr Gin Ala Arg Gly Gly Tyr Glu Ala 
165 170 175 

Asd Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 
180 185 190 

Asp Arg Asp Arg Lys Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 
195 200 205 

Leu Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 
210 215 220 

£so Glu =ro Thr Asn Aso Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 
225 ~ 230 235 240 

Aso His Leu Ala Gly His Arg Gly Thr Val He Ala Val Thr His Asp 
245 250 255 

fra Val Phe Leu Aso Arg Leu Thr Thr Thr He Leu Glu Val Asp Ser 
250 * 265 270 

Gly Ser Val Thr Arg Tvr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 
275 280 285 

Lys Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 
290 295 300 

Ala Glu Leu Asp Arg Asn Arg Gly Leu He Thr Ser Asn Val Ala Arg 
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305 310 315 320 

Met Asp Gly He Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 

325 330 335 

Ala Tyr Arg Arg Arg Gly Arg Asp Kis Gly Ala Met Val Arg He Arg 

340 345 350 

Asn Ala Lys Gin Arg Val Ala Gin Leu Thr Glu Asn Pro Val Kis Ala 



355 360 365 

Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg He Asp Thr Ala Gly Pro 
370 375 380 

Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 
385 390 395 400 

Arg Leu Ala Val Asp Ser Leu Thr He Arg Pro Gly Glu Arg Leu Leu 
405 410 415 

Val Thr Gly Pro Asn Gly Ala Gly Lys Ser Thr Leu Leu Arg Val Leu 
420 425 430 

Ser Gly Glu Leu Glu Pro Asp Gly Gly Ser Val Arg Val Gly Cys Arg 
435 440 445 

Val Gly His Leu Arg Gin Asp Glu Thr Pro Trp Ala Pro Gly Leu Thr 
450 455 460 

Val Leu Arg Ala Phe Ala Gin Gly Arg Glu Gly Tyr Leu Glu Asp Kis 
465 470 475 480 

Ala Glu Lys Leu Leu Ser Leu Gly Leu Phe Ser Pro Ser Asp Leu Arg 
485 490 495 

Arg Arg Val Lys Asp Leu Ser Tyr Gly Gin A.rg Arg Arg He Glu He 
500 505 510 

Ala Arg Leu Val Ser Asp Pro Met Asp Leu Leu Leu Leu Aso Glu Pro 
515 520 525 

Thr Asn His Leu Thr Pro Val Leu Val Glu Glu Leu Glu Gin Ala Leu 
530 535 540 

Ala Asp Tyr Arg Gly Ala Val Val Val Val Thr His Asp Arg Arg Met 
545 550 555' 560 

Arg Ser A.rg Phe Thr Gly Ala Arg Leu Thr Met Gly Asp Gly Arg He 
565 570 575 

Ala Glu Phe Ser Ala Gly 
580 



<210> 51 
<211> 557 
<212> PRT 

< 2 1 3 > Streptomyces ambofaciens 
<400> 51 

Val Glu Thr Gly Asp Leu Arg Val Ser He Ala Gin Tyr Ala Leu His 
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1 5 10 15 

Asp lie Thr Lys Arg Tyr His Asp Cys Val Val Leu Asp Arg Val Gly 
20 25 30 

Phe Ser lie Lys Pro Gly Glu Lys Val Gly Val He Gly Asp Asn Gly 
35 40 45 

Ser Gly Lys Ser Thr Leu Leu Lys lie Leu Ala Gly Arg Val Glu Pro 
50 5 5 60 

Asp Asn Gly Ala Leu Thr Val Val Ala Pro Gly Gly Val Gly Tyr Leu 
65 70 75 80 

\la. Gin Thr Leu Glu Leu Pro Leu Asp Ala Thr Val Gin Asp Ala. Val 
85 90 9o 

Asp Leu Ala Leu Ser Asp Leu Arg Glu Leu Glu Ala Ala Met Arg Glu 
100 105 110 

Ala Glu Ala Glu Leu Gly Glu Ser Asp Glu Asn Gly Ser Glu Arg Glu 
115 120 125 

Leu Ser Ala Gly Leu Gin Arg Tyr Ala Ala Leu Val Glu Gin Tyr Gin 
130 135 140 

Ala Arg Gly Gly Tvr Glu Ala Asd Val Arg Val Glu Val Ala Leu Kis 
145 ~ 150 155 160 

Gly Leu Gly Leu Pro Ser Leu Asp Arg Asp Arg Lys Leu Gly Thr Leu 
165 170 175 

Ser Gly Gly Glu Arg Ser Arg Leu Ala Leu Ala Ala Thr Leu Ala Ser 
180 185 190 

Ser Pro Glu Leu Leu Leu Leu Asp Glu Pro Thr Asn Asp Leu Asp Asp 
195 200 205 

Arg Ala Met Glu Trp Leu Glu Asp His Leu Ala Gly His Arg Gly Thr 
210 215 220 

Val He Ala Val Thr His Asp Arg Val Phe Leu Asp Arg Leu Thr Thr 
225 230 235 240 

Thr He Leu Glu Val Asp Ser Gly Ser Val Thr Arg Tyr Gly Asn Gly 
245 250 255 

Tyr Glu Gly Tyr Leu Thr Ala Lys Ala Val Glu Arg Glu Arg Arg Leu 
260 265 270 

Arg Glu Tyr Glu Glu Trp Arg Ala Glu Leu Asp Arg Asn Arg Gly Leu 
275 280 235 

He Thr Ser Asn Val Ala Arg Met Asp Gly lie Pro Arg Lys Met Ser 
290 295 300 

Leu Ser Val Phe Gly His Gly Ala Tyr Arg Arg Arg Gly Arg Asp His 
305 310 315 320 



Gly Ala Met Val Arg He Arg Asn Ala Lys Gin Arg Val Ala Gin Leu 
325 330 335 
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Thr Glu Asn Pro Vai Kis Ala Pro Ala Asp Pro Leu Ser Phe Ala Ala 
340 345 350 

Arg lie Asp Thr Ala Gly Pro Glu Ala Glu Glu Ala Val Ala Glu Leu 
355 350 365 

Thr Asp Val A.rg Val Ala Gly Arg Leu Ala Val Asp Ser Leu Thr lie 
370 375 380 



Arg Pro Gly Glu Arg Leu Leu Val Thr Gly Pro Asn Gly Ala»Gly-Lys 
385 390 395 400 

Ser Thr Leu Leu Arg Val Leu Ser Gly Glu Leu Glu Pro Asp Gly Gly 
405 410 415 

Ser Val Arg Val Gly Cys Arg Val Gly His Leu Arg Gin Asp Glu Thr 
420 425 430 

Pro Trp Ala Pro Gly Leu Thr Val Leu Arg AJ_a Phe Ala Gin Gly. Arg 
435 440 445 

Glu Gly Tyr Leu Glu Asp Kis Ala Glu Lys Leu Leu Ser Leu Gly Leu 
450 455 460 

Phe Ser Pro Ser Asp Leu Arg Arg Arg Val Lys Asp Leu Ser Tyr Gly 
465 470 475 480 

Gin Arg Arg Arg lie Glu lie Ala Arg Leu Val Ser Asp Pro Met Asp 
485 490 495 

Leu Leu Leu Leu Asp Glu Pro Thr Asn His Leu Thr Pro Val Leu Val 
500 505 510 

Glu Glu Leu Glu Gin Ala Leu Ala Asp Tyr Arg Gly Ala Val Val Val 
515 520 525 

Val Thr Kis Asp Arg Arg Met Arg Ser Arg Phe Thr Gly Ala Arg Leu ■ 
530 535 540 

Thr Met Gly Asp Gly Arg lie Ala Glu Phe Ser Ala Gly 
545 550 555 



<210> 52 
<211> 550 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 52 

Val Ser lie Ala Gin Tyr Ala Leu His Asp lie Thr Lys Arg Tyr Kis 
15 10 15 

Asp Cys Val Val Leu Asp Arg Val Gly Phe Ser lie Lys Pro Gly Glu 
20 25 30 

Lys Val Gly Val lie Gly Asp Asn Gly Ser Gly Lys Ser Thr Leu Leu 
3 5 4 0 4 5 

Lys lie Leu Ala Gly Arg Val Glu Pro Asp Asn Gly Ala Leu Thr Val 
50 55 60 
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Val AT a *ro Glv Gly Val Gly Tvr Leu Ala Gin Thr Leu Glu Leu Pro 
65 * 70 75 80 

L-u ^sp Ala Thr Val Gin Asp Ala Val Asp Leu Ala Leu Ser Asp Leu 
85 90 55 

Arg Glu Leu Glu Ala Ala Met Arg Glu Ala Glu Ala Glu Leu Gly Glu 
100 105 HO 

Ser a sp Glu Asn Glv Ser Glu Arg Glu Leu Ser Ala Gly Leu Gin Arg 
115 120 125 

T Vr Ala Ala Leu Val Glu Gin Tyr Gin Ala Arg Gly Gly Tyr Glu Ala 
"* 130 135 140 

asp Val Arg Val Glu Val Ala Leu His Gly Leu Gly Leu Pro Ser Leu 
14 5 ~ ~ 150 155 160 

Asp Arg Asp Arg Lvs Leu Gly Thr Leu Ser Gly Gly Glu Arg Ser Arg 
165 170 175 

L*u Ala Leu Ala Ala Thr Leu Ala Ser Ser Pro Glu Leu Leu Leu Leu 
180 185 190 

Asp Glu Pro Thr Asn Asp Leu Asp Asp Arg Ala Met Glu Trp Leu Glu 
195 200 205 

Asp His Leu Ala Gly His Arg Gly Thr Val He Ala Val Thr His Asp 
210 215 220 

Arg Val Phe Leu Asp Arg Leu Thr Thr Thr He Leu Glu Val Asp Ser 
225 230 235 240 

Gly Ser Val Thr Arg Tyr Gly Asn Gly Tyr Glu Gly Tyr Leu Thr Ala 
245 250 255 

• Lvs Ala Val Glu Arg Glu Arg Arg Leu Arg Glu Tyr Glu Glu Trp Arg 
260 265 270 

Ala Glu Leu Asp Arg Asn Arg Gly Leu He Thr Ser Asn Val Ala Arg 
275 280 285 

Met Aso Gly He Pro Arg Lys Met Ser Leu Ser Val Phe Gly His Gly 
290 295 t 300 

Ala Tvr Arg Arg Arg Gly Arg Asp His Gly Ala Met Val Arg He Arg 
305 ~ " ~ 310 315 320 

Asn *la Lys Gin Arg Val Ala Gin Leu Thr Glu Asn Pro Val His Ala 
325 330 335 

Pro Ala Asp Pro Leu Ser Phe Ala Ala Arg He Asp Thr Ala Gly Pro 
340 345 350 

Glu Ala Glu Glu Ala Val Ala Glu Leu Thr Asp Val Arg Val Ala Gly 
355 360 365 

Arg Leu Ala Val Asp Ser Leu Thr He Arg Pro Gly Glu Arg Leu Leu 
370 375 380 
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Val Thr Gly Pro Asn 
385 

Ser Gly Glu Leu Glu 
4C5 

Val Gly His Leu Arg 
420 

Val Leu "Arg "Ala Phe 
435 

Ala Glu Lys Leu Leu 
450 

Arg Arg Val Lys Asp 
465 

Ala Arg Leu Val Ser 
485 

Thr Asn His Leu Thr 
500 

Ala Asp Tyr Arg Gly 
515 

Arg Ser Arg Phe Thr 
530 

Ala Glu Phe Ser Ala 
545 



Gly Ala Gly Lys Ser Thr 
390 395 

Pro Asp Gly Gly Ser Val 
410 

Gin Asp Glu Thr Pro Trp 
425 

Ala Gin Gly Arg "Glu Gly 
440 

Ser Leu Gly Leu Phe Ser 
455 

Leu Ser Tyr Gly Gin Arg 
470 475 

Asp Pro Met Asp Leu Leu 
490 

Pro Val Leu Val Glu Glu 
505 

Ala Val Val Val Val Thr 
520 

Gly Ala Arg Leu Thr Met 
535 

Gly 
550 



Leu Leu Arg Val Leu 
400 

Arg Val Gly Cys Arg 
415 

Ala Pro Gly Leu Thr 
430 

Tyr "Leu Glu Asp His " 
445 

Pro Ser Asp Leu Arg 
460 

Arg Arg lie Glu lie 
480 

Leu Leu Asp Glu Pro 
495 

Leu Glu Gin Ala Leu 
510 

His Asp Arg Arg Met 
525 

Gly Asp Gly Arg He 
540 



<2I0> 53 

<211> 1431 

<212> ADN 

< 2 1 3 > Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (1) . . (1431) 

<220> 

<221> CDS 

<222> (16) . . (1431) 

<220> 

<221> CDS 

<222> (37) . . (1431) 

<220> 

<221> CDS 

<222> (40) . . (1431) 

<220> 

<221> CDS 

<222> (79) . . (1431) 



<220> 
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<221> CDS 

<222> (130) . . (1431) 
<400> 53 

gtg ccg cgc aac ggt ate cgt gzc gca ccg gec gac gtg atg cag teg 
Val Pro Arg Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gin Ser 
15 10 15 



aac cac age ggt ctt tea cga gag ggg teg ace atg ggc gat etc agg 
Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg 
35 40 45 



43 



gac egg gat gat cgc ttg tec ggc ggc egg atg cct age etc ggg age 9 6 
Asp Arg Asp Aso Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser 
20 2 5 3 0 



144 



aac cgc ate ace gag ctg gtc cgc gcg tac cac egg gaa cag gcg ccc 19 2 
Asn Arg He Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gin Ala Pro 
50 55 60 

ggg ggc ttc gtt ccc ggg acg acg cac gta ccg gtc tec ggc gcg gtg 240 
Gly Gly Phe Val Pro Gly Thr Thr Kis Val Pro Val Ser Gly Ala Val 
65 " 70 75 80 

ctg age gag gag gac egg ctg gcg ctg gtg gag acg gcg ctg gag atg 2 88 
Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met 
85 90 95 

egg ate gcg gee ggc ccg gec tec egg ggc ttc gag egg cag ttc gee 336 
Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gin Phe Ala 
100 105 HO 

egg tac etc ggg etc egg aag gcg cac ctg ace aac tec ggt tec tec 
Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser 
115 120 125 

gec aac etc etc gec etc ggc gcg etc acc teg ccg cag ctg gag gag 
Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gin Leu Glu Glu 
130 135 140 

aga egg ctg cgt ccg ggg gac gag gtc gtc acg gtc gec gee ggg ttc 
Arg Arg Leu Arg Pro Gly Aso Glu Val Val Thr Val Ala Ala Gly Phe 
145 " 150 155 160 

ccc acg acg gtc aac ccg ate ttc cac aac ggg ctg gtg ccc gtc ttc 
Pro Thr Thr Val Asn Pro He Phe Kis Asn Gly Leu Val Pro Val Phe 
165 170 175 

gtg gac gtc gag etc ggc acg tac aac acg acg ccc gag cgc ate gag 57 6 
Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg He Glu 
180 185 190 

egg gee ate ggc ccc egg acc agg gcg ate atg ate gcg cac gec ctg 624 
Arg Ala He Gly Pro Arg Thr Arg Ala lie Met He Ala Kis Ala Leu 
195 200 205 

ggc aac ccc ttc gag gee gaa gag gtg gee cgc etc gcg gac gag egg 672 
Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg 
210 215 220 



3 84 



432 



480 



528 



gag ctg ttc etc ate gag gac aac tgc gac gcg gtg ggg tec cgc tac 



720 
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Glu Leu Phe Leu lie Glu Asp Asn Cys Asp Ala Val Gly Ser Arg Tyr 
225 230 235 240 

egg ggc agg etc acc ggc tec ttc ggc gac ctg teg acc gtc age etc 768 
Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe 
245 250 255 

tat ccc gcg cac cac ate gcg atg ggt gag ggg ggc tgc gtg etc acc 816 
Tyr Pro Ala His His lie Ala Met Gly Glu Gly Gly Cys Val Leu Thr 
260 ' " 265 270" 

gac aac ctg gec ctg geg egg ate gtg gaa tea ctg cgc gac tgg ggg 86 4 
Asp Asn Leu Ala Leu Ala Arg lie Val Glu Ser Leu Arg Asp Trp Gly 
275 280 285 

cgc gac tgc tgg tgc gag ccg ggt gag gac aac cgc tgc etc aag egg 912 
Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg 
290 295 300 

ttc gac cag aag atg ggt gac ctg ccg ccc ggg tac gac cac aag tac 960 
Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp His Lys Tyr 
305 310 315 320 

ate ttc teg cac gtc ggt tac aac ctg aag teg acc gac ctg cag gcg 1008 
lie Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gin Ala 
325 330 335 

gec etc ggg ctg tec cag ctg acc egg ate gag gag ttc acc gag gec 1056 
Ala Leu Gly Leu Ser Gin Leu Thr Arg lie Glu Glu Phe Thr Glu Ala 
340 345 350 

agg cgc gec aac tgg egg cat ctg cgc gee gcg ttg gac ggg ctg ccc 1104 
Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro 
355 360 365 

ggt ctg ctg ctg cct cat gec aca ccg ggc age gat ccg age tgg ttc 1152 
Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe 
370 375 380 

ggg ttc etc ate acc gtg gac ccg gac gec gcg tac age agg gcg gec 1200 
Gly Phe Leu lie Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala 
385 390 395 400 

ctg gtc gac cac ctg gaa teg cgc egg ate age acc cgc cgc ctg ttc 1248 
Leu Val Asp His Leu Glu Ser Arg Arg lie Ser Thr Arg Arg Leu Phe 
405 410 415 

ggg ggc aac etc gtg egg cac ccc gec tac acc gac cgt egg tac egg 1296 
Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg 
420 425 430 

gtg tec ggc tec ctg gag aac age gac ctg ate acc gac cag acg ttc 1344 
Val Ser Gly Ser Leu Glu Asn Ser Asp Leu lie Thr Asp Gin Thr Phe 
435 440 445 

tgg ate ggg gtc ttc ccc ggc ate acc ccg gag atg ate gec tac gtc 1392 
Trp lie Gly Val Phe Pro Gly lie Thr Pro Glu Met lie Ala Tyr Val 
450 455 460 

ggc gac acg ate egg gag ttc gtg etc aag cac tec tga 1431 
Gly Asp Thr lie Arg Glu Phe Val Leu Lys His Ser 
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465 470 475 



<210> 54 
<211> 476 
<212> PRT 

<213> Streptomyces ambof aciens 

<400> 54 n 
Val Pro Arc Asn Gly Met Arg Val Ala Pro Ala Asp Val Met Gin Ser 
1 5 10 15 

Asp Arg Asp Asd Arg Leu Ser Gly Gly Arg Met Pro Ser Leu Gly Ser 
2 0 25 30 

Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly Asp Leu Arg 
35 40 45 

Asn Arg He Thr Glu Leu Val Arg Ala Tyr His Arg Glu Gin Ala Pro 
50 55 60 

Gly Gly *he Val Pro Gly Thr Thr His Val Pro Val Ser Gly Ala Val 
65 " 70 75 80 

Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala Leu Glu Met 
85 90 95 

Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg Gin Phe Ala 
100 105 HO 

Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser Gly Ser Ser 
115 "* 120 125 

Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gin Leu Glu Glu 
130 135 140 

Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe 
145 150 155 160 

Pro Thr Thr Val Asn Pro He Phe His Asn Gly Leu Val Pro Val Phe 
165 170 175 

Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu Arg He Glu 
180 185 190 

Arg Ala He Gly Pro Arg Thr Arg Ala He Met He Ala His Ala Leu 
195 200 205 

Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg 
210 215 220 

Glu Leu Phe Leu He Glu Asd Asn Cys Asp Ala Val Gly Ser Arg Tyr 
225 230 235 240 

£rg Glv Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe 
245 250 2 55 

Tyr Pro Ala Kis His He Ala Met Gly Glu Gly Gly Cys Val Leu Thr 
260 265 270 



Asp Asn Leu Ala Leu Ala Arg He Val Glu Ser Leu Arg Asp Trp Gly 
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275 280 285 

Arg Asp Cys Trp Cys Glu Pro Glv Glu Asr> Asn Arg Cys Leu Lvs Ara 
290 295 300 

Phe Asp Gin Lys Met Glv Asp Leu Pro Pro Glv Tvr Asn His Lvs Tvr 
305 31*0 315 " 320 

II e_ Phe Ser His Val Gly Tyr A sn Leu Lys Ser Thr Asp Leu Gin Ala 

325 33 _ 0 335 

Ala Leu Gly Leu Ser Gin Leu Thr Arg lie Glu Glu Phe Thr Glu Ala 
340 345 350 

Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro 
355 360 365 

Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe 
370 375 380 

Gly Phe Leu lie Thr Val Asp Pro Asp Ala Ala Tyr Ser Arg Ala Ala 
385 390 395 400 

Leu Val Asp His Leu Glu Ser Arg Arg He Ser Thr Arg Arg Leu Phe 
405 410 ^ 415 

Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg 
42 0 42 5 ' 430 

Val Ser Gly Ser Leu Glu Asn Ser Asp Leu He Thr Asp Gin Thr Phe 
435 440 445 

Trp He Gly Val Phe Pro Gly He Thr Pro Glu Met He Ala Tvr Val 
450 455 450 

Gly Asp Thr He Arg Glu Phe Val Leu Lys His Ser 
465 470 475 



<210> 55 
<211> 471 
<212> PRT 

<213> Streptomyces 



ambofaci ens 



<400> 55 

Met Arg Val Ala Pro 
1 5 

Leu Ser Gly Gly Arg 
20 

Ser Arg Glu Gly Ser 
35 

Leu Val Arg Ala Tyr 
50 

Gly Thr Thr His Val 
65 

Arg Leu Ala Leu Val 



Ala Asp Val Met Gin 
10 

Met Pro Ser Leu Gly 
25 

Thr Met Gly Asp Leu 
40 

His Arg Glu Gin Ala 
55 

Pro Val Ser Gly Ala 
70 

Glu Thr Ala Leu Glu 



Ser Asp Arg Asp Asp Arg 
15 

Ser Asn His Ser Gly Leu 
30 

Arg Asn Arg He Thr Glu 
45 

Pro Gly Gly Phe Val Pro 
60 

Val Leu Ser Glu Glu Asp 
7 5 80 

Met Arg He Ala Ala Gly 
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85 



90 35 



D ro ft la Se^ Arg Gly Phe Glu Arg Gin Phe Ala Arg Tyr Leu Gly Leu 
100 105 HO 

Lys Ala His Leu Thr Asn Ser Gly Ser Ser Ala Asn Leu Leu Ala 
115 120 125 

Leu Giv Ala Leu Thr Ser Pro Gin Leu Glu Glu Arg Arg Leu Arg Pro 

135 140 



130 



Gly Asp Glu Val Val Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn 
145 



150 I" I 60 



i^o He Phe His Asn Gly Leu Val Pro Val Phe Val Asp Val Glu Leu 
165 170 175 

Glv ^hr ^yr Asn Thr Thr Pro Glu Arg He Glu Arg Ala He Gly Pro 
' 180 185 190 

Arg Thr Arg Ala He Met He Ala Kis Ala Leu Gly Asn Pro Phe Glu 
195 200 205 

Ala Glu Glu Val Ala Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu He 
210 215 220 

Glu Asp Asn Cvs Asp Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr 
225 ** 230 235 240 

Gly Ser Phe Gly Asp Leu Ser Thr Val Ser Phe Tyr Pro Ala His Kis 
245 250 255 

He *la Met Glv Glu Gly Gly Cys Val Leu Thr Asp Asn Leu Ala Leu 
260 265 270 

Ala Arg He Val Glu Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys 
275 280 285 

Glu Pro Gly Glu Asp Asn Arg Cys Leu Lys Arg Phe Asp Gin Lys Met 
290 295 300 

Glv Asd Leu Pro Pro Gly Tyr Asp His Lys Tyr He Phe Ser Kis Val 
305 ~ 310 315 320 

Gly Tyr Asn Leu Lys Ser Thr Asp Leu Gin Ala Ala Leu Gly Leu Ser 
325 330 335 

Gin Leu Thr Arg He Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp 
340 345 350 

Arg His Leu Arg Ala Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro 
355 360 365 

His Ala Thr Pro Gly Ser Asp Pro Ser Trp Phe Gly Phe Leu He Thr 
370 375 380 

Val Asp Pro Asd Ala Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu 
385 ~ 390 395 400 

Glu Ser Arg Arg He Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val 
" 405 410 415 
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Arg His Pro Ala Tyr Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu 

420 425 430 

Glu Asn Ser Asp Leu He Thr Asp Gin Thr Phe Trp He Gly Val Phe 

455 440 445 

Pro Gly He Thr Pro Glu Met He Ala Tyr Val Gly Asp Thr He Arg 

450 455 460 



Glu Phe Val Leu Lys His Ser 
465 470 



<210> 56 

<21i> 464 

<212> PRT 

< 2 1 3 > Streptomyces ambofaciens 

<400> 56 

Val Met Gin Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro 
1 5 10 15 

Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met 
20 25 30 

Gly Asp Leu Arg Asn Arg He Thr Glu Leu Val Arg Ala Tyr His Ara 
35 40 45 

Glu Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val 
50 55 60 

Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr 
65 70 75 80 

Ala Leu Glu Met Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu 
85 90 95 

Arg Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn 
100 105 110 

Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro 
115 120 125 

Gin Leu Glu Glu Arg Arg Leu Arg Pro Gly Asd Glu Val Val Thr Val 
130 135 140 

Ala Ala Gly Phe Pro Thr Thr Val Asn Pro He Phe His Asn Gly Leu 
145 150 155 * 160 

Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro 
165 170 175 

Glu Arg lie Glu Arg Ala He Gly Pro Arg Thr Arg Ala He Met He 
ISO 185 190 

Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Ara Leu 
135 200 205 

Ala Asp Glu Arg Glu Leu Phe Leu He Glu Asn Asn Cys Aso Ala Val 
210 215 220 
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Gly Ser Arg Tvr Ara Gly Arg Leu Thr Gly Ser ?he Gly Asp Leu Ser 
225 " " " 230 235 240 

•Thr Val Ser Phe Tyr Pro Ala His His He Ala Met Gly GIu Gly Gly 
245 250 255 

Cvs Val Leu Thr Asp Asn Leu Ala Leu Ala Arg He Val Glu Ser Leu 
260 265 270 

Ara Asp Tro Gly Arg Aso Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg 
275 ^ ~ 280 285 

Cys Leu Lvs Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly Tyr 
290 295 300 

Asp His Lys Tvr He Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr 
305 " " 310 315 320 

Asp Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu Glu 
325 330 335 

Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu 
340 345 350 

Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp 
355 360 365 

Pro Ser Trp Phe Gly Phe Leu He Thr Val Asp Pro .Asp Ala Ala Tyr 
370 375 380 

Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg lie Ser Thr 
385 390 395 400 

Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr Asp 
405 410 415 

Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu He Thr 
420 425 430 

Asp Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro Glu Met 
435 440 445 

He Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys His Ser 
450 455 460 



<210> 57 
<211> 463 
<212> PRT 

<213> S crept ontyces ambof aciens 
<400> 57 

Met Gin Ser Asp Arg Asp Asp Arg Leu Ser Gly Gly Arg Met Pro Ser 
15 10 15 

Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser Thr Met Gly 
20 25 30 



Aso Leu Arg Asn Arg lie Thr Glu Leu Val Arg Ala Tyr His Arg Glu 
35 40 45 
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Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val Pro Val Ser 

50 55 60 

Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val Glu Thr Ala 

65 70 75 80 

Leu Glu Met Arg lie Ala Ala Gly Pro Ala Ser Arg Gly Phe Glu Arg 

85 90 95 



Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr Asn Ser 
100 105 110 

Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser Pro Gin 
115 120 125 

Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu Val Val Thr Val Ala 
130 135 140 

Ala Gly Phe Pro Thr Thr Val Asn Pro lie Phe His Asn Gly Leu Val 
145 150 155 160 

Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr Pro Glu 
165 170 175 

Arg lie Glu Arg Ala lie Gly Pro Arg Thr Arg Ala He Met He Ala 
180 185 190 

His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg Leu Ala 
195 200 205 

Asp Glu Arg Glu Leu Phe Leu He Glu Asp Asn Cys Asp Ala Val Gly 
210 215 220 

Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu Ser Thr 
225 230 235 240 

Val Ser Phe Tyr Pro Ala Kis His He Ala Met Gly Glu Gly Gly Cys 
245 250 255 

Val Leu Thr Asp Asn Leu Ala Leu Ala Arg He Val Glu Ser Leu Arg 
260 265 270 

Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn Arg Cys 
275 280 285 

Leu Lys Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro Gly Tyr Asp 
290 295 300 

His Lys Tyr He Phe Ser His Val Gly Tyr Asn Leu Lys Ser Thr 'Asp 
305 310 315 320 

Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu Glu Phe 
325 330 335 

Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala Ala Leu Asp 
340 345 350 



Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly Ser Asp Pro 
355 360 365 
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Ser Trp Phe Gly 
370 

Arg Ala Ala Leu 
385 

Arg Leu Phe Gly 



Arg Tyr Arg Val 
420 

Gin Thr Phe Trp 
435 

Ala Tyr Val Gly 
450 



Phe Leu lie Thr 
375 

Val Asp His Leu 
390 

Gly Asn Leu Val 
405 

Ser Gly Ser Leu 



lie Gly Val Phe 
440 

Asp Thr lie Arg 
455 



Val Asp Pro Asp 
380 



Glu Ser Arg Arg 
395 

Arg His Pro Ala 
410 

Glu Asn Ser Asp 
425 

Pro Gly He Thr 



Glu Phe Val Leu 
460 



Ala Ala Tyr Ser 



He Ser Thr Arg 
400 

Tyr Thr Asp Arg 
415 

Leu He Thr Asp 
430 

Pro Glu Met He 
445 

Lys His Ser 



<210> 58 
<211> 450 
<212> PRT 

<213> Streptomyces ambof aciens 

<400> 58 _ 
Met ^ro Ser Leu Gly Ser Asn His Ser Gly Leu Ser Arg Glu Gly Ser 
15 10 15 

^hr Met Giv Asp Leu Arg Asn Arg He Thr Glu Leu Val Arg Ala Tyr 
20 25 30 

His Arg Glu Gin Ala Pro Gly Gly Phe Val Pro Gly Thr Thr His Val 
35 40 45 

Pro Val Ser Gly Ala Val Leu Ser Glu Glu Asp Arg Leu Ala Leu Val 
50 55 60 

Glu Thr Ma Leu Glu Met Arg He Ala Ala Gly Pro Ala Ser Arg Gly 
65 70 75 80 

D^e Glu Arg Gin Phe Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu 
85 90 95 

Thr >sn Ser Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr 
100 105 >t HO 

Ser ^ro Gin Leu Glu Glu Arg Arg Leu Arg Pro Gly Asp Glu. Val Val 
115 120 125 

Thr Val Ala Ala Gly Phe Pro Thr Thr Val Asn Pro He Phe His Asn 
130 135 140 

Gly Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr 
145 . 150 155 160 

Thr Pro Glu Arg He Glu Arg Ala He Gly Pro Arg Thr Arg Ala He 
165 170 175 

Met He Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala 
180 185 150 
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Arg Leu Ala Asp Glu Arg Glu Leu Phe Leu lie Glu Asp Asn Cys Asp 
195 200 205 

Ala Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp 

210 215 220 

Leu Ser Thr Val Ser Phe Tyr Pro Ala His His He Ala Met Gly Glu 

225 230 235 240 



Gly Gly Cys Val L,eu Thr Asp Asn Leu Ala Leu Ala Arg He Val Glu 
245 250 • 255 

Ser Leu Arg Asp Trp Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp 
260 265 270 

Asn Arg Cys Leu Lys Arg Phe Asp Gin Lys Met Gly Asp Leu Pro Pro 
275 280 285 

Gly Tyr Asp His Lys Tyr He Phe Ser His Val Gly Tyr Asn Leu Lys 
290 295 300 

Ser Thr Asp Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He 
305 310 315 320 

Glu Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg His Leu Arg Ala 
325 330 335 

Ala Leu Asp Gly Leu Pro Gly Leu Leu Leu Pro His Ala Thr Pro Gly 
340 345 350 

Ser Asp Pro Ser Trp Phe Gly Phe Leu He Thr Val Asp Pro Asp Ala 
355 360 365 

Ala Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg He 
370 375 380 

Ser Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tvr 
385 390 395 400 

Thr Asp Arg Arg Tyr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu 
405 410 415 

He Thr Asp Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro 
420 425 " 430 

Glu Met He Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys 
43b 440 445 

His Ser 
450 



<210> 59 
<211> 433 
<212> PRT 

<213> Streptomyces ambof aciens 
<400> 59 

Met Gly Asp Leu Arg Asn Arg He Thr Glu Leu Val Arg Ala Tyr His 
1 5 10 15 
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Arg Glu Gin Ala Pro Gly Glv ?he Val Pro Gly Thr Thr His Val Pro 
20 25 30 

Val Ser Glv Ala Val Leu Ser Glu Glu Asp Arg Leu Ala. Leu Val Glu 
35 40 4b 

Thr Ala Leu Glu Met Arg He Ala Ala Gly Pro Ala Ser Arg Gly Phe 
50 55 60 

Glu A^g Gin ^he Ala Arg Tyr Leu Gly Leu Arg Lys Ala His Leu Thr 
65 * ~ 70 75 80 

*sn S^r Gly Ser Ser Ala Asn Leu Leu Ala Leu Gly Ala Leu Thr Ser 
85 90 55 

Pro Gin Leu Glu Glu Arg Arg Leu Arg Pro Giy Asp Glu Val Val Thr 
100 105 110 

Val 21a Ala Gly Phe Pro Thr Thr Val Asn Pro He Phe His Asn Gly 
115 120 125 

Leu Val Pro Val Phe Val Asp Val Glu Leu Gly Thr Tyr Asn Thr Thr 
130 135 140 

Pro Glu Arg He Glu Arg Ala He Gly Pro Arg Thr Arg Ala He Met 
145 150 155 160 

He Ala His Ala Leu Gly Asn Pro Phe Glu Ala Glu Glu Val Ala Arg 
165 170 175 

Leu Ala Asp Glu Arg Glu Leu Phe Leu He Glu Asp Asn Cys Asp Ala 
180 185 190 

Val Gly Ser Arg Tyr Arg Gly Arg Leu Thr Gly Ser Phe Gly Asp Leu 
195 200 205 

Ser Thr Val Ser Phe Tyr Pro Ala His His He Ala Met Gly Glu Gly 
210 215 220 

Gly Cys Val Leu Thr Asp Asn Leu Ala Leu Ala Arg He Val Glu Ser 
225 230 235 240 

Leu Arg Asp Tro Gly Arg Asp Cys Trp Cys Glu Pro Gly Glu Asp Asn 
245 250 255 

Arg Cys Leu Lys Arg Phe Asp Gin Lys Met Gly Asp' Leu Pro Pro Gly 
260 265 270 

Tvr Asp His Lvs Tyr He Phe Ser His Val Gly Tyr Asn Leu Lys Ser 
275 " " 280 285 

Thr Asp Leu Gin Ala Ala Leu Gly Leu Ser Gin Leu Thr Arg He Glu 
250 235 300 

Glu Phe Thr Glu Ala Arg Arg Ala Asn Trp Arg Kis Leu Arg Ala Ala 
305 310 315 320 

Leu Asp Gly Leu Pro Glv Leu Leu Leu Pro His Ala Thr Pro Gly Ser 
325 " 330 335 

Asp Pro Ser Trp Phe Gly Phe Leu He Thr Val Asp Pro Asp Ala Ala 
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340 345 350 

Tyr Ser Arg Ala Ala Leu Val Asp His Leu Glu Ser Arg Arg lie Ser 
355 360 365 

Thr Arg Arg Leu Phe Gly Gly Asn Leu Val Arg His Pro Ala Tyr Thr 
370 375 380 

Asp Arg Arg Tvr Arg Val Ser Gly Ser Leu Glu Asn Ser Asp Leu lie 

3 85" 3-9-0 7— 3-95 — 400" 

Thr Asp Gin Thr Phe Trp He Gly Val Phe Pro Gly He Thr Pro Glu 
405 410 415 

Met He Ala Tyr Val Gly Asp Thr He Arg Glu Phe Val Leu Lys His 
420 425 430 

Ser 



<210> 60 

<211> 1398 . . 

<212> ADN 

<213> Strep tomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1398) 

<400> 60 

atg gac gac acg atg gcc ggc gcc gac gcc gag gaa tgg gac ggc gat 48 

Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp 
15 10 15 

cag tta gac cgc gag gac egg gcc tec etc cgc cgc gtc gcg ggg etc 9 6 
Gin Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu 
20 25 30 

tec acc gaa ctg acc gac gtc tec gag gtc gag tac cgc cag ctg cga 144 
Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gin Leu Arg 
35 40 45 

etc gag egg gtg gtg etc gtc ggc ate tgg acc teg gga acg gcc gcg 192 
Leu Glu Arg Val Val Leu Val Gly He Trp Thr Ser Gly Thr Ala Ala 
50 55 60 

gag gcc gac agt teg etc gcc gag ctg gcg gcg etc gcc gag acc gcg 2 40 
Glu Ala Asp Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala 
65 70 75 80 

ggc gcc etc gtg ctg gac ggc gtc gtg cag cgc egg cag aag ccg gac 2 88 
Gly Ala Leu Val Leu Asp Gly Val Val Gin Arg Arg Gin Lys Pro Asp 
85 90 95 

ccg gcg acg tac ate ggc teg ggc aag gcg teg cag ctg cgc gac ate 33 6 
Pro Ala Thr Tyr He Gly Ser Gly Lys Ala Ser Gin Leu Arg Asp He 
100 105 110 

gtc gag gag acc ggc gcc gac acc gtg gtg tgc gac ggg gaa ctg age 3 84 
Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser 
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115 120 12b 



ccc agt cag ctg azg cac ctg gag gag gtc gtc ggg gtc aag gtc gtg 432 
Pro Ser Gin Leu Met His Leu Glu Glu Val Val Gly Val Lys Val Val 
130 135 140 

gac cgc acg gcc ctg ate ctg gac ate ttc gcg cag cac gec cag tec 480 
2>so ^rg vfrr Ala Leu He Leu Asp He Phe Ala Gin His Ala Gin Ser 
145 " 150 155 160 

egg gaa ggc aag gcg cag gtg gcg ctg gcg cag atg cag tac atg ctg 52 8 
arg Glu Gly Lys Aia Gin Val Ala Leu Ala Gin Met Gin Tyr Met Leu 
165 170 175 

ccg egg ctg cac gge tag ggc cag teg ctg tec egg cag atg ggc ggc 576 
p ro Arg Leu Arg Gly Trp Gly Gin Ser Leu Ser Arg Gin Met Gly Gly 
180 185 190 

ggt gac ggc agt gge atg gec acg cgc ggt ccc ggt gag acg aag ate 
Gly Gly Giy Gly Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys He 
195 200 205 

gag acg gac egg egg egg ate aac gac aag atg gcc agg etc cgc egg 
Glu Thr Asp Arg Arg Arg He Asn Asp Lys Met Ala Arg Leu Arg Arg 
210 215 220 

gag ctg gag cag ctg aag ace ggc egg gac gtg aac egg gag gag cga 
Glu Leu Glu Gin Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg 
225 230 235 240 

egg cgc aac aag gtg ctg teg gtc gcc etc gcc ggc tac acc aac gcc 
Arg Arg Asn Lys Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala 
245 250 • 255 

ggc aag tea teg ctg etc aac cgc etc acc gga gcc ggc gtg ctg gtg 
Giy Lys Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val 
260 265 270 

gag aac gcc ctg ttc gcc acc ctg gac acg acc gtg egg egg gcg acg 
Giu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr 
275 280 285 

acg ccg age ggg cgc ccc tac acc ate gcc gac acc gtg ggc ttc gta 
Thr Pro Ser Gly Arg Pro Tyr Thr He Ala Asp Thr Val Gly Phe Val 
290 295 >t 300 

cgc cac etc ccg cac cac ctg gtg gag gcg ttc cgt tec acg ate gaa 
Arg t h-s Leu t>ro His His Leu Val Glu Ala Phe Arg Ser Thr He Glu 
305 310 315 320 

gag gtc gcg gac gcg cat ctg gtg ctg cac gtg gtc gac ggt teg cac 
Glu Val Ala ^so Ala His Leu Val Leu His Val Val Asp Gly Ser His 
325 330 335 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



ccg gac ccc gge gcg cag ctg gcc teg gtg cgc gag gtg ctg egg gac 1056 

Pro Asp Pro Gly Ala Gin Leu Ala Ser Val Arg Glu Val Leu Arg Asp 
340 345 350 

gtg gge gcc gge gag tec acc gag gtc gtg gtc gtc aac aag gcc gat 1104 

Val Gly Ala Giy Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp 
355 360 365 
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gtc gcg gac ccg gac gtc etc gec cgt ctg ctg gag cag gag ccg gac 1152 
Val Ala Asp Pro Asp Val Leu Ala Arg Leu Leu Glu Gin Glu Pro Asp 
370 375 380 

gcg ate gtc gtg tec gec cgt teg ggt egg ggc ate gac gag ctg egg 12 0 0 
Ala lie Val Val Ser Ala Arg Ser Gly Arg Gly He Asp Glu Leu Arg 
385 390 395 400 

gaa ctg ate gac cgc ctg" ctg ccg'cac ccc "gag gtg gag gtg gag "gtc T248 
Glu Leu He Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val 
405 410 415 

gtg ate ccc tac gac gag ggg age ctg gtg gcg egg gtg cac gac gag 12 9 6 
Val He Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val His Asp Glu 
420 425 430 

ggc gag gtg etc age ace gag cac acg ccg gag ggc ace erg etc ace 1344 
Gly Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr 
435 440 445 

gcg egg gtc cac ccc gae etc gee teg gag ctt egg acg ctt ccg egg 
Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg 
450 455 460 

ccg tga 13 9 8 

Pro 

465 



1392 



<210> 61 
<211> 465 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 61 

Met Asp Asp Thr Met Ala Gly Ala Asp Ala Glu Glu Trp Asp Gly Asp 
15 10 15 

Gin Leu Asp Arg Glu Asp Arg Ala Ser Leu Arg Arg Val Ala Gly Leu 
20 25 30 

Ser Thr Glu Leu Thr Asp Val Ser Glu Val Glu Tyr Arg Gin Leu Arg 
35 40 45 

Leu Glu Arg Val Val Leu Val Gly He Trp Thr Ser Gly Thr Ala Ala 
50 55 60 

Glu Ala Asd Ser Ser Leu Ala Glu Leu Ala Ala Leu Ala Glu Thr Ala 
65 70 75 SO 

Gly Ala Leu Val Leu Asp Gly Val Val Gin Arg Arg Gin Lys Pro Asp 
85 90 95 

Pro Ala Thr Tyr He Gly Ser Gly Lys Ala Ser Gin Leu Arg Asp He 
100 105 110 

Val Glu Glu Thr Gly Ala Asp Thr Val Val Cys Asp Gly Glu Leu Ser 
115 120 125 



Pro Ser Gin Leu Met His Leu Giu Glu Val Val Gly Val Lys Val Val 
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130 



135 140 



Asp Arg Thr Ala Leu He Leu Asp He Phe Ala Gin His Ala Gin Ser 
145 150 155 

Arc Glu Glv Lys Ala Gin Val Ala Leu Ala Gin Met Gin Tyr Met Leu 
165 170 i7 => 

pt-o Arg Leu Arg Gly Trp Gly Gln.Ser Leu Ser Arg Gin Met Gly Gly 
ISO 185 190 

Glv Gly Glv Glv Gly Met Ala Thr Arg Gly Pro Gly Glu Thr Lys - lie 
19 5 200 205 

niu Thr Asp ?rg Arg Arg He Asn Asp Lys Met Ala Arg Leu Arg Arg 
210 ~ 215 220 

Glu Leu Glu Gin Leu Lys Thr Gly Arg Asp Val Asn Arg Glu Glu Arg 
225 230 235 240 

Arg Arg Asn Lvs Val Leu Ser Val Ala Leu Ala Gly Tyr Thr Asn Ala 
245 250 255 

Glv Lvs Ser Ser Leu Leu Asn Arg Leu Thr Gly Ala Gly Val Leu Val 
260 ~ 265 270 

Glu Asn Ala Leu Phe Ala Thr Leu Asp Thr Thr Val Arg Arg Ala Thr 
275 280 285 

Thr Pro Ser Glv Arg Pro Tyr Thr He Ala Asp Thr Val Gly Phe Val 
290 295 300 

A^~g His Leu Pro His Kis Leu Val Glu Ala Phe Arg Ser Thr He Glu 
305 310 315 320 

Glu Val Ala Aso Ala His Leu Val Leu His Val Val Asp Gly Ser His 
325 330 335 

Pro Asp Pro Gly Ala Gin Leu Ala Ser Val Arg Glu Val Leu Arg Asp 
340 345 350 

Val Gly Ala Gly Glu Ser Thr Glu Val Val Val Val Asn Lys Ala Asp 
355 360 36d 

Val Ala Aso Pro Asp Val Leu Ala Arg Leu Leu Glu Gin Glu Pro Asp 
370 375 380 

Ala He Val Val Ser Ala Arg Ser Gly Arg Gly He Asp Glu Leu Arg 
385 390 395 400 

G^u Leu He Asp Arg Leu Leu Pro His Pro Glu Val Glu Val Glu Val 
405 410 415 

Val He Pro Tyr Asp Glu Gly Ser Leu Val Ala Arg Val Kis Asp Glu 
420 425 430 

Glv Glu Val Leu Ser Thr Glu His Thr Pro Glu Gly Thr Leu Leu Thr 
435 440 445 

Ala Arg Val His Pro Asp Leu Ala Ser Glu Leu Arg Thr Leu Pro Arg 
450 455 460 
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Pro 
465 



<210> 62 
<211> 1044 
<212> ADN 

_ <2"r3^~srrepXolny"c"e"s~ainbaf arrens- 



<220> 

<221> CDS 

<222> (1) . . (1044) 

<400> 62 

atg cga gta etc att ate ggg ggt tea cag ttc gtg ggc egg gee ttc 

M~t Arg Val Leu lie He Gly Gly Ser Gin Phe Val Gly Arg Ala Phe 
1 5 10 15 

gee gee gag gca ctg gee gcg ggg cac egg gtc ace acg ttc aac egg 
£la Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg 
20. 25 30 

ggt gtc age ggc acc gac ctg ccc ggc gtc gag gcg gtc agg ggc gac 
Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp 
35 40 45 



gac gac tea cct gee cac gac tgc ceg ccg gac gec gga ceg gac cac 
Asp Asp Ser Pro Ala His Asp Cys Pro Pro Asp Ala Gly Pro Asp His 
115 12 0 12 5 



etc ggg ccg cac gac acc atg cgc atg etc gac gec tag ctg tgg cgc 
Leu Gly Pro His Aso Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg 
165 170 175 



48 



96 



144 



cgc gag gtg gee ggc gac ctg gag egg ctg gtg tec gga agg cac tgg 192 

Arg Glu Val Ala Gly Asp Leu Glu Arg Leu Val Ser Gly Arg His Trp 

50 55 60 

gac gcg gtc gtg gac acc tgc ggt tac gtg ccc cgc acg gtg ggg gec 2 40 

Asp Ala Val Val Asp Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala 

65 70 75 80 

teg gee gcg gcg ctg tec ggg cac gcg gac acc tac etc tac gtc tec 

Ser Ala Ala Ala Leu Ser Gly His Ala Asp Thr Tyr Leu Tyr Val Ser 

85 90 95 

age ate gee tgc ctg ccc gac tgg gcg cag gcg gtc cgt ccg gtg gac 33 6 

Ser He Ala Cys Leu Pro Asp Trp Ala Gin Ala Val Arg Pro Val Asp 

100 105 110 



288 



;84 



gee gac ggt gac tac ggc gtc ctg aag gec ggc tgc gag cgc gee gtg 432 

Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val 
130 135 140 

gac egg cac ttc gcg ggc egg acc ctg cac ctg egg gee ggt gtc ate 480 

Asp Ara His Phe Ala Gly Arg Thr Leu Kis Leu Arg Ala Gly Val lie 
145 150 155 160 



528 



atg cgc gtc gee gag ggg gag cac cgc egg gtg etc gec ceg ggc aac 



576 
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M~t Arg Val Ala Giu Gly Glu His Arg Arg Val Leu Ala Pro Gly Asn 
180 185 190 

ccc aag gtg ggc atg cgc ctg ate gac gta cgc gat gtc gec gtc ttc 62 4 

Pro Glu. Val Gly Met Arg Leu lie Asp Val Arg Asp Val Ala Val Phe 

195 " 200 205 

age etc gac tgc etc gcg gac ggc cgt acc ggc gee ttc ate gtc aac 67 2 

Gly Leu Asp Cys Leu Ala Asp Gly Arg Thr Gly Ala Phe ile Val Asn 

210 215 220 



ccg cog gag aag aac acc acc ttc ggg gag ttg etc acg gag tgc gtc 
o-o P^-o Glu Lvs Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val 
225 .' 230 235 240 

aag acc acc ggt teg gee gcg gag ccg gtg tgg gtc gac gag ggg ttc 
Lvs Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Pne 
245 250 25d 

etc acc gag cac ggc gtg agt ccg tgg acg gac ctg ccg atg tgg gtg 
Leu Ala Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val 
260 265 270 

ecc gac acc gcg egg gac acc etc gtg tgg gcg gee gga gca ccg cgc 
Pro Asp Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg 
275 280 285 

gec egg gec gcg ggt ctg gec tgc egg ccc ttc tec gac acc gtg egg 
Ala Arg Ala Ala Glv Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg 
290 295 300 

gac acc tgg gag gtc gtc egg gac egg ccc gtc ccg gaa ctg ccg etc 
Asp Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro i,eu 
305 310 315 320 

gcg acc ggc tgc ggc ctg tec ctg age egg gag aag gag ctg etc gec 
Ala Ala Gly Cys Glv Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala 
325 330 335 

gec tgg gac get cgc ggc ggt gcg gcg gcg ggc tga 
Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly 
340 345 



<210> 63 
<211> 347 
<212> PRT 

< 2 1 3 > Streptomyces ambof aciens 

<400> 63 ^ n 
Met Arg Val Leu Ile lie Gly Gly Ser Gin Phe Val Gly Arg Ala Phe 
1 5 10 15 

*la Ala Glu Ala Leu Ala Ala Gly His Arg Val Thr Thr Phe Asn Arg 
20 25 30 

Gly Val Ser Gly Thr Asp Leu Pro Gly Val Glu Ala Val Arg Gly Asp 
35 40 45 

Arg Glu Val Ala Gly Asp Leu Giu Arg Leu Val Ser Gly Arg His Trp 
50 55 60 



720 



768 



816 



864 



912 



960 



1008 



1044 
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zJLa Val Val Asr> Thr Cys Gly Tyr Val Pro Arg Thr Val Gly Ala 
"65 ~ 7 0 75 BO 

q« r ^la z= la Ma Leu Ser Glv His Ala Asp Thr Tyr Leu Tyr Val Ser 
85 90 95 

Ser lie Ala Cys Leu Pro Asp Trp Ala Gin Ala Val Arg Pro Val Asp 
100 105 HO 



Aso AST) Ser Pro Ala- His -Asp Cys Pro Pro Asp Ala Gly Pro . Asp Eis 
115 120 125 

Ala Asp Gly Asp Tyr Gly Val Leu Lys Ala Gly Cys Glu Arg Ala Val 
130 135 1^0 

L qo t rg His ^he Ala Gly Arg Thr Leu His Leu Arg Ala Gly Val He 
V45 150 155 160 

L~u G-iv Pro His Asr> Thr Met Arg Met Leu Asp Ala Trp Leu Trp Arg 
165 170 175 

tvi^- * rg Val Ma Glu Glv Glu His Arg Arg Val Leu Ala Pro Gly Asn 
180 " 185 • 190 

Pro Glu Val Gly Met Arg Leu He Asp Val Arg Asp Val Ala Val Phe 
195 200 205 

Gly Leu Asp Cvs Leu Ala Asp Gly Arg Thr Gly Ala Phe He Val Asn 
210 215 220 

z> ro ^ro Glu Lvs Asn Thr Thr Phe Gly Glu Leu Leu Thr Glu Cys Val 
225 230 235 240 

Lvs Ala Thr Gly Ser Ala Ala Glu Pro Val Trp Val Asp Glu Gly Phe 
245 250 255 

Leu Ma Glu His Gly Val Ser Pro Trp Thr Asp Leu Pro Met Trp Val 
260 265 270 

Pro Aso Thr Ala Arg Asp Thr Leu Val Trp Ala Ala Gly Ala Pro Arg 
275 280 285 

Ala Arg Ala Ala Gly Leu Ala Cys Arg Pro Phe Ser Asp Thr Val Arg 
290 295 300 

Aso Ala Trp Glu Val Val Arg Asp Arg Pro Val Pro Glu Leu Pro Leu 
305 " 310 315 320 

Ala Ala Glv Cys Gly Leu Ser Leu Ser Arg Glu Lys Glu Leu Leu Ala 
325 330 335 

Ala Trp Asp Ala Arg Gly Gly Ala Ala Ala Gly 
340 345 



<21G> 64 
<2il> 1041 
<212> ADN 

< 2 1 3 > Streptomyces ambof aciens 



1er depot 

102 



<220> 

<221> CDS 

<222> (1) - . (1041) 



a : g acc "acc ctg agt act tct get gaa ccg ttc gec gca ccc ggc ccg 4 8 
Ml? ^ iia Leu 5lv Thr Ser Ala Glu Pro Phe Ala Ala Pro Giy Pro 

ccg egg ccg gaa gcg tec ccg gtg ctg cgc ttc gga gcg ate ggc tgc 
t>-o *ro Pro Glu Ala Ser Pro Val Leu Arg Pne Gxy ne Gly Cys 

20 25 30 

aac aac ate gcg ggc cgt cgc acc ctg ccc gec ctg etc tec ace ccc 
Gly Asp He Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Tnr P.o 
35 ^0 45 

aac acc gtg ctg acc tgc gtc ggc age cgc gac gcg gac egg gec aag ' 
Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala -ys 
50 55 60 

acc eta gac agg cac ttc gac cgc gag gcg gtc gcg ccc tac gag gec 
Ala Leu Gly Arg His Phe Aso Cys Glu Ala Val Ala Pro Tyr Glu Ala 
65 70 75 80 

eta ctg gaa cgc ccc gac gtg gac gec gtc tac ate gcg gtg ccc age 
Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr He Ala Val Pro Ser 
85 90 95 

atg eta cac gee craa tgg gec gcg gcg gcg ctg egg gcg ggc aaa cac 
Met Leu His Ala Glu Trp Ala Ala Ala Ala Leu Arg Ala Gly Lys His 
100 105 HO 

ate etc atg gag aag ccc gec gee gec aac cac' gec gac gcg gee cgc 
Val Leu Val Glu Lys Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg 
115 120 125 

ctg ttc gee atg gee egg gag cgc gga ctg gta ctg atg gag aac ttc 
Leu ^he *la Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe 
130 135 140 

atg ttc etc cac cac tct caa cac gee acc gtc aaa gec ctg ttg gag 
Met Phe Leu His Kis Ser Gin His Ala Thr Val Lys Ala Leu Leu Glu 
145 150 155 1^0 

acc got gee ate gga gag ctg cgc ace ttc tec gee gec ttc acc ate 
»la Glv Ala He Gly Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr He 
165 170 175 

ccg ccg cgc gee gac gac gac acg cgc tac cga ccc gac ate ggc ggc 
D ro r> ro * rg Ala Asp Aso Aso Met Arg Tyr Arg Pro Asp He Gly Gly 
180 1S5 ISO 

age gca ctg etc gac aac ggc gtc tac ccg ctg egg gee gcg ctg cac 
Gly Ala Leu Leu Asp Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu His 
195 200 205 



96 



144 



132 



240 



288 



336 



384 



432 



480 



528 



576 



624 



ttc etc aga ccc gaa ctg cgc ctg acc ggc gee gtg ccg cgc cgt gac 672 
Phe Leu Glv Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp 
210 215 220 



1er depot 
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cgc cgc egg ggc gtc gtg gtc tec ggc age gtc ctg etc gee gee cec 72 0 

Arg Ara Arc; Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro 
225 ' 230 235 240 

cag ggc gtg gee gee cac etc gec ttc ggc atg gaa cae ggc tac cgc 768 

Gin Gly Val Ala Ala His Leu Ala Phe Gly Met Glu His Gly Tyr Arg 

245 250 255 



Xcg~gcg" t ac— gag^c t g-cac -ggc-agc-acc- -ggc- teg- -etc- - ge c-ct g -ag c- -cac 81-6- 

Ser Ala Tvr Glu Leu Kis Gly Ser Thr Gly Ser Leu Ala Leu Ser His . 
260 265 270 

gtc ttc acg acc ccg gac age cac cac ccc gta ctg egg ctg tec cgc 864 
Val Phe Thr Thr Pro Asp Ser His Kis Pro Val Leu Arg Leu Ser Arg 

280 285 



27o 



cag gac cac egg gag gag cgc gtc ctg ccc gtg gac egg cac ttc gtg 
Gin Aso His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val 
290 295 300 



912 



aac ate ctg teg gtc ttc cgc cgt gcg gtg ate egg gec gag gac gtc 9 60 
Asn He Leu Ser Val Phe Arg Arg Ala Val He Arg Ala Glu Asp Val 
305 310 315 320 

tec gee gag teg tac gec gcg ctg cgc cag gcg ggg ctg gtc gac gag 1008 
Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gin Ala Gly Leu Val Asp Glu 
325 330 335 

ate gtg gec cgc gee gag acc ttc acc gtg tag 1041 
lie Val AiLa A.rg Ala Glu Thr Phe Thr Val 
340 345 



<210> 65 
<211> 346 
<212> PRT 

<213> Strep tomyces ambofaciens 
<400> 65 

Met Thr Ala Leu Gly Thr Ser Ala Glu Pro Phe Ala Ala Pro Gly Pro 
15 10 15 

Pro Arg Pro Glu Ala Ser Pro Val Leu Arg Phe Gly Ala He Gly Cys 
20 25 30 

Gly Asp He Ala Gly Arg Arg Thr Leu Pro Ala Leu Leu Ser Thr Pro 
35 40 45 

Gly Thr Val Leu Thr Cys Val Gly Ser Arg Asp Ala Asp Arg Ala Lys 
50 55 60 

Ala Leu Gly Arg His Phe Asp Cys Glu Ala Val Ala Pro Tyr Glu Ala 
65 70 75 80 

Leu Leu Glu Arg Pro Asp Val Asp Ala Val Tyr He Ala Val Pro Ser 
85 SO 95 

Met Leu His Ala Glu Trp Ala Ala Ala ■ Ala Leu Arg Ala Gly Lys His 
100 1C5 110 



1er depot 
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Val Leu Val Glu Lvs Pro Ala Ala Ala Asn His Ala Asp Ala Ala Arg 
115 120 125 

Leu ^h- * la Met Ala Arg Glu Arg Gly Leu Val Leu Met Glu Asn Phe 
130 135 140 

Met Phe Leu Kis Kis Ser Gin His Ala Thr Val Lys Ala Leu Leu Glu 
145 150 155 160 

* -a Gly *ia lie Glv Glu Leu Arg Thr Phe Ser Ala Ala Phe Thr He 
165 170 175 



Pro Pro Arg 



g Ala Asp Asp Asp Met Arg Tyr Arg Pro Asp lie Gly Gly 



180 185 190 



GW Ala Leu Leu Asn Asn Gly Val Tyr Pro Leu Arg Ala Ala Leu Kis 
195 200 205 

Ph- Leu Gly Pro Glu Leu Arg Leu Thr Gly Ala Val Leu Arg Arg Asp 
210 * 215 220 

*-g Arg Arg Gly Val Val Val Ser Gly Ser Val Leu Leu Ala Ala Pro 
225 230 235 240 

Gin Gly Val Ala Ala Kis Leu Ala Phe Gly Met Glu Kis Gly Tyr Arg 
245 250 2^5 

S^r Ala Tyr Glu Leu Kis Gly Ser Thr Gly Ser Leu Ala Leu Ser Kis 
260 265 270 

Val Phe Thr Thr Pro Asp Ser His Kis Pro Val Leu Arg Leu Ser Arg 
275 280 285 

Gin Asp His Arg Glu Glu Arg Val Leu Pro Val Asp Arg His Phe Val 
290 295 300 

Asn He Leu Ser Val Phe Arg Arg Ala Val He Arg Ala Glu Asp Val 
305 310 315 320 

Ser Ala Glu Ser Tyr Ala Ala Leu Arg Gin Ala Gly Leu Val Asp Glu 
325 330 335 

He Val Ala Arg Ala Glu Thr Phe Thr Val 
340 345 



<210> 66 
<211> 1239 
<212> ADN 

< 2 1 2 > Streptomyces ambofaciens 

<22C> 

<221> CDS 

<222> (1) . . (1239) 

<400> 66 

gtg acg gac gcg ate a eg acc gag 

Val Thr Asp Ala He Thr Thr Glu 

1 5 



ctg gec gae cge gaa ctg ggg cgc 4S 
Leu Ala Asp Arg Glu Leu Gly Arg 
10 15 
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aga ctg cac egg eta cgc ggc gtc cac tag tat etc ggc aac cac ggt 5 6 
Arg Leu His Arg He Arg Gly Val Kis Trp Tyr Phe Giy Asn Kis Gly 
20 25 30 



gac ccg tac gec etc ate ctg cgc ggt cag ace gac gac ccg L.cg g^g 

Asp Pro Tyr Ala Leu lie Leu Arg Gly Gin Thr Asp Asp Pro Ser Val 

35 40 45 

tac gag gag egg gtc cgc gag ggc ggg ccg ctg ttc cgc age cgt aec 

"Ty:r~G"luHGlir~^ 

50 55 60 



1 LL 



is: 



240 



ggg ace tag gtg ace gcg gac ccg gag gtg gec gcg gee gtg ctg ggc 

Gly Thr Tro Val Thr Ala Aso Pro Glu Val Ala Ala Ala Val Leu Gly 
65 " 70 75 80 

gac teg cgc ttc ggt gcg ctg gac cgc gee gga egg cgc ccg gag gag 

Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu 

85 9 0 9 5 

tac etc cag ccg teg ccc gec acg tac ctg ggg ctg gac cgc gee gcg 33 5 

Tyr Leu Gin Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala 

,.100 .... . 105 . 110 

tac gcg cgt ctg egg egg gtg gee gag ccc gtg ctg ggc gcg gac gee 3 84 

Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala 
115 120 125 

gee gee gcg tgg cgc egg etc ggc gag gac gtc ggg cgc egg ctg etc 432 

Ala Ala Ala Trp Arg Arg Leu Gly Glu Asp Val Gly Arg Arg Leu Leu 

130 135 140 

gee ggc cgc ggt tec ggc etc gac ctg acg gcg gac ttc gee cgc egg 4 SO 

Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg 

145 150 155 160 

ctg ccg gca ttg gtc ctg gee gcg tgg etc ggg gtg ccg ggc gaa egg 52 8 

Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg 

165 170 175 

tgc gac gag tgg gag gag teg ctg egg gcg gcg ggg ccg ctg ctg gac 57 6 

Cys Asp Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp 

180 185 ISO 

ggt ctg ctg tgt ccg cag acg ctg gcg gee ace cgt gcg gcg gac teg 624 

Gly Leu Leu Cys Pro Gin Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser 
195 200 205 

gee gee gag ggg ctg cgc gcg ctg ttg gac gag gtg gtc gee gcg cgt 672 

Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg 

210 215 220 

ccc ggc ggg tec ggc gag ggt gcg gtg gee cgc atg gtc ggc gec gga 720 

Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly 

225 230 235 240 

gec gec ccc gac gac gcg gtg gec gee gee gtg tgc ctg gcg etc teg 7 63 

Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser 

245 250 255 



ace 



gtc gaa ccg acg acg ace ctg gtg tgc gaa gcg gtc egg ctg ctg 816 
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Ala Val Giu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu 
25C 265 270 

etc gac cga ccc gag tgg tgg egg egg ttg tgc gac tec ccc get etc 
Leu \sv> Arg Pro Giu Tro Trp Arg Arg Leu Cys Asp Ser Pro Ala i,eu 
275 280 285 

gca ccg gee gcg gte egg cac acc ctg egg eac gcg ccc ccg gtg egg 
lla ?r o Ala Ala Val Arg Kis Thr Leu Arg Kis Ala Pro Pro val Arg 
29C 295 300 

-to qag aac caa gtg gee cac gag gac gtg acg gtg gcg gat cgt ccg 
Leu Glu Ser Arg Val Ala His Giu Asp Val Thr Val Ala Asp Arg Pro 
305 310 315 320 

eta ccc occ agg age cac gtg gtg gtg etc gtg ggc gcg gca egg cgc 
Leu *ro aia Giy Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg 
325 330 335 

acg ggc gec ccg gec gcg gag ccg gcg gac ctg gcg ggc gca ccg gcg 
*la Gly Ala Pro Ala Ala Giu Pro Ala Asp Leu Ala Gly Ala Pro Ala 
340 345 350 

gee aaa ctg ccg gac gac ctg tgg ttc gcg ctg tec ggg gag ttc gte 
Glu Leu Pro Aso Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe val 
355 350 365 

aac cgt gee gec aag acc gcg ctg ggc gtg ctg gec gag gec gee ccg 
Giy Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro 
370 375 380 

gga eta cag cag gac ggc gac ate gte egg egg cgc cgt tec ccg gte 
Gly Leu Arg Arg Asp Gly Aso lie Val Arg Arg Arg Arg Ser Pro Val 
385 390- 395 . 400 

etc ggc agg tac gcg egg ttc ccc gte gcg tac tec tga 
Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser 
405 410 



<210> 67 
<211> 412 
<212> PRT 

< 2 1 3 > Streptomyces ainbof aciens 
<400> 67 

Val Thr Asp Ala lie Thr Thr Glu Leu Ala Asp Arg Glu Leu Giy Arg 
15 10 15 

Prg Leu His Arg lie Arg Gly Val His Trp Tyr Phe Gly Asn His Gly 
20 25 30 

Asp D ro Tvr Ala Leu lie Leu Arg Gly Gin Thr Asp Asp Pro Ser Val 
" . 35 40 45 

Tyr Glu Glu Arg Val Arg Glu Gly Gly Pro Leu Phe Arg Ser Arg Thr 
50 55 60 

qi v t**^ T-re> Val Thr Ala Aso Pro Giu Val Ala Ala Ala Val Leu Giy 
55 " 70 " 75 80 



864 



912 



960 



1008 



.056 



1104 



1152 



1200 



1239 
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Asp Ser Arg Phe Gly Ala Leu Asp Arg Ala Gly Arg Arg Pro Glu Glu 
85 90 95 

Tyr Leu Gin Pro Ser Pro Ala Thr Tyr Leu Gly Leu Asp Arg Ala Ala 
100 105 110 

Tyr Ala Arg Leu Arg Arg Val Ala Glu Pro Val Leu Gly Ala Asp Ala 
115 120 125 

Ala Ala AXa Trp "Arg" Arg" Leu Gly "Glu ATsp Val Gly~Arg Arg "Leu Leu 
130 135 140 

Ala Gly Arg Gly Ser Gly Leu Asp Leu Thr Ala Asp Phe Ala Arg Arg 
145 150 155 160 

Leu Pro Ala Leu Val Leu Ala Ala Trp Leu Gly Val Pro Gly Glu Arg 
165 170 175 

Cvs Aso Glu Trp Glu Glu Ser Leu Arg Ala Ala Gly Pro Leu Leu Asp 
180 185 190 

Gly Leu Leu Cys Pro Gin Thr Leu Ala Ala Thr Arg Ala Ala Asp Ser 
195 .. 200 205 

Ala Ala Glu Gly Leu Arg Ala Leu Leu Asp Glu Val Val Ala Ala Arg 
210 215 220 

Pro Gly Gly Ser Gly Glu Gly Ala Val Ala Arg Met Val Gly Ala Gly 
225 230 235 240 

Ala Ala Pro Asp Asp Ala Val Ala Ala Ala Val Cys Leu Ala Leu Ser 
245 250 255 

Ala Val Glu Pro Thr Thr Thr Leu Val Cys Glu Ala Val Arg Leu Leu 
260 265 270 

Leu Asp Arg Pro Glu Trp Trp Arg Arg Leu Cys Asp Ser Pro Ala Leu 
275 280 285 

Ala Pro Ala Ala Val Arg His Thr Leu Arg His Ala Pro Pro Val Arg 
290 295 300 

Leu Glu Ser Arg Val Ala His Glu Asp Val Thr Val Ala Asp Arg Pro 
305 310 315 320 

Leu Pro Ala Gly Ser His Val Val Val Leu Val Gly Ala Ala Arg Arg 
325 330 335 

Ala Gly Ala Pro Ala Ala Glu Pro Ala Asp Leu Ala Gly Ala Pro Ala 
340 345 350 

Ala Glu Leu Pro Asp Asp Leu Trp Phe Ala Leu Ser Gly Glu Phe Val 
355 360 365 

Gly Arg Ala Ala Glu Thr Ala Leu Gly Val Leu Ala Glu Ala Ala Pro 
370 375 380 

Gly Leu Arg Arg Asp Gly Asp lie Val Arg Arg Arg Arg Ser Pro Val 
385 390 395 400 

Leu Gly Arg Tyr Ala Arg Phe Pro Val Ala Tyr Ser 
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405 



<210> 68 
<2Ii> 1272 
<212> ADN 

<213> Streptomyces ambofaciens 

<22C> 

<221> CDS 

<222> (I) - - (1272) 



< 4 0 0 > 68 fc , _ / o 

gto cgc ate ctg gtg acc tec ate ccg cac cac acg cac ,ac .ac _ca 
?2 Arc Val Leu val Tar 3er He Pro His His Thr His Tyr Tyr His 

10 15 



1 3 



ctg gta ccg ctg ate tgg get etg cat gee tea ggg cac gag gtg gtg 
Leu Ve^ Pro Leu lie Tro Ala Leu Arg Ala Ser Gly His Glu Val Vd 
20 25 - 30 

acg acc age cag ccg teg ctg gtc gac gee ate acc gec age ggc ate 
Ala Gly Gin Pro Ser Leu Val Asp Ala He Thr Ala Ser Gly He 

35 40 45 

cca gcg ttc gec ctg gec gag gag gag teg ctg gcg cag ate ttc gag 
Pro a Phe Ala Leu Ala Glu Glu Glu Ser Leu Ala Gin lie Phe Glu 
50 - 55 60 

gag ate aaa aac gat etc cag ccg tat cag cac ggc ate gac gag ttc 
Glu Val Glu GIv Aso Leu Gin Pro Tyr Gin His Gly He Asp Glu Phe 
65 ' 70 75 80 

gac *-tc ttc aac acc ctg aag gac gag ctg gac tgg gag aag ctg etc 
^ P o he Phe Gly Thr Leu Lys Asp Glu Leu Asp Trp Glu Lys Leu Leu 
85 90 35 

acc cag cag gtg ate ctg tec ggc ctg tgg ctg gaa ccg etc aac ggc 
Ala Gin Gin Val lie Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Gly 
100 105 lio 

gee aea acc etc gac age ate gtc gac ttc gee egg gec tgg aag ccc 
Ala Thr Thr Leu Aso Ser He Val Asp Phe Ala Arg Ala Trp Lys Pro 
115 120 t 125 

aac eta gtg ctg tgg gag ccg ttc acc tat gcg ggg ccg gtg gcg gec 
Asp Leu val Leu Tro Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala 
130 135 1^0 

cag gcg tgc gag gec gcg cac gec cgc gtc ctg tgg ggg ccg gac acg 
arg *«a Cvs Gly Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr 
V45 " 150 155 150 

ate aag ctg ctg egg acg aag ttc ctt cag gee cag gcg cgt cag ccc 
Ti e Gly Lea Leu Arg Thr Lvs Phe Leu Gin Ala Gin Ala Arg Gin Pro 
165 170 175 

aaa aag cac egg aac aac ccg gtc gcg gag tgg atg acc tgg gec ctg 
Glu Gl- -is i-g z= so Aso Pro Val Ala Glu Trp Met Thr Trp Ala Leu 
130 ■ " 185 130 



96 



144 



192 



240 



28S 



33^ 



384 



432 



480 



528 
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aC g cgc tac ggg tgc gac etc egg gag gag gac gtg etc ggt ca,j egg 62: 

a la Aro Tvr Gly Cys Asp Phe Arg Glu Glu Asp Val Leu Gly Gin Trp 
195 200 20d 

age gtg gac ccg atg gcg gag ggc gte agt etc ggc etc gac ctg ccg 672 

Ser Val Asc p ro Met Ala Glu Glv Val Sex Leu Gly Leu Asp Leu Pro 
210 215 220 

■ ac c ate ccg atg cgc -tac --ace- ccg tac -aac ggg teg- gcg geg ate cce 72.0_... 

Th~ Val Pro M»t ^ro Tvr Thr Pro Tvr Asn Gly Ser Ala Val ile Pro 
225 ~ ' ~ 230 235 240 



gac tag ctg acc gag aaa ccg aaa egg cct egg gtc cgc ctg ace c^g 
*so ^id Leu Thr Glu Glu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu 
245 250 2sd 



768 



aag atg tec teg egg gag cac agt gag gac gag gee ccg gtg eag agg S±6 

Gly Val Ser Ser Arg Glu His Ser Glu Asp Glu Val Pro Val Gin Arg 
260 265 270 

ttt ate gag gcg ctg gee gat etc gac ate gag ctg gtg gcg acc ctg 864 

Phe Ile Glu Ala Leu Ala Asp Leu Asp lie Glu Leu Val Ala Thr Leu 
275 280 285 

gac gac gee eag egg gac ctg ctg ccg agg ate ccg gac aac acg cgc 

Aso Asp Ala Gin Arg Asp Leu Leu Pro Arg lie Pro Asp Asn Thr Arg 
290 295 300 

ate gtc gac ttc gtg cce atg gac gcg ttg ctg ccg acg cgc teg gcg 

Ile Val As-o Phe Val Pro Met Asp Ala Leu Leu Pro Thr Cys Ser Ala 
305 310 315 320 

ate ate aac cac age ggt teg ggc acg tgc aac acc gec gcg ctg cac 

lie lie Ksn His Ser Gly Ser Gly Thr Cys Asn Thr Ala Ala Leu His 

325 330 335 

ggg gtg ccg eag ate ate etc ggc ggc ate ctg gac gec gee gta egg 1056 
Gly Val Pro Gin lie lie Leu Gly Gly lie Leu Asp Ala Ala Val Arg 
340 345 350 



912 



960 



1008 



cag cac atg ttc gcg cag aac tec gec gec etc acc ttc get ccg gag 1104 
Gin His Met Phe Ala Gin Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu 
355 360 365 

gag gtg acc ggc gcg teg ctg agg age gcg ctg gtg cgc ctg etc gag 11-2 
Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu 
370 375 380 

gag ccg egg ttc cgc gac ggc gcg egg egg ctg aag gag egg atg egg 1200 
Glu Pro Arg Phe Arg Asp Gly Ala Arg Arg Leu Lys Glu Arg Met Arg 
385 390 395 400 

gee atg eec age ccg gec ggg ate gtg ccg acc ctg gag cgc etc acg 1243 

Ala Met Pro Ser Pro Ala Gly lie Val Pro Thr Leu Glu Arg Leu Thr 

405 410 415 

*, '> n 9 

gee cag cac cgc egg gcg tg ^ uga -± ~ 

Ala Gin His Arg Arg Ala Cys 
42 0 
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<210> 6S 
<211> 423 
<212> ??-T 

<2I2> Streptomyces airoof aciens 
<40C> 69 

Val ^rg Val Leu Val Thr Ser He Pro His Kis Thr His Tyr Tyr His 
1 " 5 10 15 

L~u V*l Leu He Tro Ala Leu Arg Ala Ser Gly His Glu Val Val 

20 25 30 

£15 &la Gly Gin Pro Ser Leu Val Asp Ala lie Thr Ala Ser Gly lie 
35 40 45 

Pro z>ia ^he Ala Leu Ala Glu Glu Glu Ser Leu Ala Gin He Phe Glu 
50 55 60 

Glu val Glu Glv Aso Leu Gin Pro Tyr Gin His Gly He Asp Glu Phe 
65 ~. 70 75 80 

>sp D he Phe Glv Thr Leu Lys Asp Glu Leu Asp Trp Giu Lys Leu Leu 
85 90 25 

*la Gin Gin Val He Leu Ser Gly Leu Trp Leu Glu Pro Leu Asn Giy 
200 105 HO 

i la Thr Thr Leu Aso ser He Val Asp Phe Ala Arg Ala Trp Lys Pro 
115 ~ 120 125 

Asp Leu Val Leu Tro Glu Pro Phe Thr Tyr Ala Gly Pro Val Ala Ala 
130 135 140 

Arg Ala Cvs Glv Ala Ala His Ala Arg Val Leu Trp Gly Pro Asp Thr 
145 150 155 -l60 

lie Gly Leu Leu Arg Thr Lys Phe Leu Gin Ala Gin Ala Arg Gin Pro 
165 170 175 

Glu Glu His Arg Aso Aso Pro Val Ala Glu Trp Met Thr Trp Ala Leu 
180 1S5 190 

*la *ra Tyr Glv Cys Aso Phe Arg Glu Giu Asp Val Leu Gly Gin Trp 
195 " ~ 200 205 

3=>r Val Aso Pro Met: Ala Glu Gly Val Ser Leu Gly Leu Asp Leu Pro 
210 215 220 

Thr Val Pro Met Arg Tyr Thr Pro Tyr Asn Gly Ser Ala Val He Pro 
225 230 235 240 

z= so Tro Leu Thr Giu Giu Pro Lys Arg Pro Arg Val Cys Leu Thr Leu 
245 250 ■ 255 

Gly Val Ser Ser Arg Glu His Ser Glu Asp Giu Val Pro Val Gin Arg 
2 60 2 65 27 0 

Phe He Glu Ala Leu Ala Asp Leu Asp He Glu Leu Val Ala Thr Leu 
275 280 235 
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Asp Asp Ala Gin Arg Asp Leu Leu Pro Arg lie Pro Asp Asn Thr Arg 

290 295 300 

lie Val ks*o ?he Val Pro Met Aso Ala Leu Leu Pro Thr Cys Ser Ala 

305 " 310 315 320 



He He Asn Kis Ser Gly Ser Gly Thr Cys Asn Thr Ala Ale 

325 330 335 



"Gly^Val"" -?ro"Gin-Tl-e~T-l e-Leu- Gl-y-G-l-y- -He— Leu— Asp- Ala. _AlaH/!al_ Ar_g__. 
340 345 



3 50 



Gin His Met Phe Ala Gin Asn Ser Ala Ala Leu Thr Phe Ala Pro Glu 
355 360 365 

Glu Val Thr Gly Ala Ser Leu Arg Ser Ala Leu Val Arg Leu Leu Glu 
370 375 380 

Glu Pro Arg Phe Arg Aso Gly Ala Arg Arg Leu Lys Glu Arg Met Arg 
385 390 395 400 

Ala Met Pro Ser Pro Ala Gly lie Val Pro Thr Leu Glu Arg Leu Thr 
405 . . . 410 4 " 

Ala Gin Kis Arg Arg Ala Cys 
420 



<210> 70 
<211> 117S 
<212> ADN 

<213> Streptorryoes ambofaciens 

<220> 

<221> CDS 

<222> (1) . - (1179) 

<400> 70 

atg egg gec etc ttc acg acc gcg ccg etc gcg ggc eac ctg ctt ecg 

'Met Arc Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro 

X 5 10 15 

ctg gtg ecc ate. gcg tgg gec ctg egg gcg gec ggc cac gag gta ctg 
Leu Val Pro He Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu 
20 25 30 

gtg gcg acc egg gag gac ttc gtg ccg gtc gec ctg egg teg ggg .ctg 
Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu 
35 . 40 45 

ccg tec gec teg tgc ggg ccg cce gec gcg gac ctg gcg ggc gcg gee 
Pro Ser Ha Ser Cvs Glv Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala 
50 55 . 60 

crag gcg ggg gcg etc gcg egg cce cge gga gcg gcg gag get egg ggg 
Glu Ala Glv Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg. Gly 
65 . 70 75 80 

ate ctg age ggg gcg ctg gcg cge gtc gee egg ggc agt ctg gcg ggg 
Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly 



1er depot 
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90 



335 



ate cag cog ctg gcg gac gec tag egg ccg gat ctg ate gtc age gaa 
val V-g Arg i^u Ala Ast> Ala Trp Arg Pro Asp Leu He Val Ser G-Lu 
100 105 HO 

~ag aec gag ttc gee ggg ccg ctg gtc geg gcg gec etc ggg gtc ccg 3 84 
a -a *la Glu Phe Ala Glv Pro Leu Val Ala Ala Ala Leu Giy Va_ Pro 
115 12 0 125 

tgo ate cgc tac cac tgg teg gtc teg tec ctg gag gag tac egg ega 
-ro Val t^a Tvr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg 
130 " - 135 140 

gco ace gag aec gag ttc gcg cec gag ctg gcg gcg etc gge etc gac 
"i a *la Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly ,eu Asp 

- - n loO 

145 lr>0 -i- 3 - 

caa ttc ccg gag gcg geg cgc gtg etc gat ccg tgg ccg gtg teg ctg 

a -a *he Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu 

165 170 175 

cac caa ccg gac gcg gtc gec cac gac ggg gtc egg cac gta ccg gee 
a^a A^g Pro Asp Ala Val Ala His Asp Gly Val Arg His Val Pro Ala 
180 185 190 

cac aaa cac ace cec gtc cec gac tgg gcg ttc acg cgc ggt cgc 1 ggg 
His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly 
195 200 205 

cca cag ate tgc gtg acg etc gge aec atg ctg cec egg. tac gge gee 
th-o ?-g He Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Giy Ala 
210 215 220 

aec aag ata gee cac ttc ctg acg gag ctg gtg geg gag aec cgc gga 
£ia Glv v x et Ala Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly 
22S " , 230 235 240 

gga aac tgc gaa ctg etc gtg gcg gtc gac gac gac gtc gtc gcg egg 
G^v Aso Cvs Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ale A,g 
245 250 255 

tea cca tea ctg cec tec geg gtg egg tac gee gge egg ctg ccg ctg 
Trp *ro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu 
750 265 270 



acg aag gtg ctg cec gcg ngc gac gcg gtg gtg cac cac gge ggg cag 
£la Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gin 
275 280 285 

age acg tec ctg aec gcg ctg gee gcg ggt egg ccg cag gtc gtc atg 
Glv Thr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gin Val Val Met 
290 295 300 

gcg egg etc gac gac cag ttc gac aac gcg egg gea ctg geg geg gcg 
Li ~ i-^g Leu Aso Aso Gin Phe Aso Asn Ala Arg Ala Leu Ala Ala Ala 
305 ~ 310 315 320 

aag acg gec ctg etc gta ccg ccg tec egg gec act cec geg gee gtg 
Glv iia Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val 
325 330 33s 
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gee gcg ggg tgc gcc gaa gtg ctg gag aac gcc ctg tat gcc aag gcg 1Cd6 

Ala Ala Gly Cys Ala Glu Val Leu GIu Asn Ala Lieu Tyr Ala Lys Ala 
340 345 350 

gca gcc ggg etc gcc gag gag atg gcg etc ctg ccg teg ccg teg gcg 1104 

Ala Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala 

355 360 365 

gcg "gtcT'gga etc ctg "gaa cac ccg ggg etc ggg ccg gac -atg ccg egg -- -lis 2- 

Ala Val Gly Leu Leu Glu Kis Pro Gly Pro Gly Pro Asp Met Pro Arg 

370 375 380 



agt tac ccg aac gag gat gcg gtg tga 
Ser Tyr Pro Asn Glu Asp Ala Val 
385 390 



<210> 71 
<211> 392 
<212> PRT 

<213> Streptomyces ambofaciens 
<400> 71 

Met Arg Ala Leu Phe Thr Thr Ala Pro Leu Ala Gly His Leu Leu Pro 
1 5 10 15 

Leu Val Pro He Ala Trp Ala Leu Arg Ala Ala Gly His Glu Val Leu 
20 25 30 

Val Ala Thr Arg Glu Asp Phe Val Pro Val Ala Leu Arg Ser Gly Leu 
35 40 45 

Pro Ser Ala Ser Cys Gly Pro Pro Ala Ala Asp Leu Ala Gly Ala Ala 
50 55 60 

Glu Ala Gly Ala Leu Ala Arg Pro Arg Gly Ala Ala Glu Ala Arg Gly 
65 " 70 75 80 

Val Leu Ser Gly Ala Leu Ala Arg Val Ala Arg Gly Ser Leu Ala Gly 
85 90 95 

Val Arg Arg Leu Ala Asp Ala Trp Arg Pro Asp Leu He Val Ser Glu 
100 105 110 

Arg Ala Glu Phe Ala Gly Pro Leu Val Ala Ala Ala Leu Gly Val Pro 
115 120 125 

Trp Val Arg Tyr His Trp Ser Val Ser Ser Leu Glu Glu Tyr Arg Arg 
130 135 140 

Ala Ala Glu Ala Glu Phe Ala Pro Glu Leu Ala Ala Leu Gly Leu Asp 
145 150 155 160 

Arg Phe Pro Glu Ala Ala Arg Val Leu Asp Pro Trp Pro Val Ser Leu 
165 170 175 

Arg Arg Pro Asp Ala val Ala His Asp Gly Val Arg His Val Pro Ala 
180 135 IS 0 

His Gly Asp Ala Pro Val Pro Asp Trp Ala Phe Thr Arg Gly Arg Gly 



.179 
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195 



200 20b 



Pro Arcr lie Cys Val Thr Leu Gly Thr Met Leu Pro Arg Tyr Gly Ala 
210 215 220 

H 6 G^y Met Ma Asp Phe Leu Thr Glu Leu Val Ala Glu Thr Arg Gly 
225 " " 230 235 240 

G iv Asp Cvs Glu Leu Leu Val Ala Val Asp Asp Asp Val Val Ala Arg 
" - 245 250 ^ 

n- D Pro Ser Leu Pro Ser Ala Val Arg Tyr Ala Gly Arg Leu Pro Leu 
250 265 270 

A* a Glu Val Leu Pro Ala Cys Asp Ala Val Val His His Gly Gly Gin 
275 280 28o 

Gly ^hr Ser Leu Thr Ala Leu Ala Ala Gly Arg Pro Gin Val Val Met 
290 295 300 

^la Pr-a Leu Asp Asp Gin Phe Asp Asn Ala Arg Ala Leu Ala Ala Ala 
305 ~ ~ 310 315 320 

Gly Ala Ala Leu Leu Val Pro Pro Ser Arg Ala Thr Pro Ala Ala Val 
325 330 33d 

Ha Ala Gly Cvs Ala Glu Val Leu Glu Asn Ala Leu Tyr Ala Lys Ala 
340 345 350 

*ia Ala Gly Leu Ala Glu Glu Met Ala Leu Leu Pro Ser Pro Ser Ala 
355 360 365 

Ala Val Gly Leu Leu Glu His Pro Gly Pro Gly Pro Asp Met Pro Arg 
370 375 380 

Ser Tyr Pro Asn Glu Asp Ala Val 
385 " 390 



<210> 72 
<21i> 993 
<212> ADN 

<213> Streptonryces arnbof aciens 

<220> 

<221> CDS 

<222> (1) . . (993) 

<400> 72 

atg aat ctg gaa gta etc aac cgt teg aac gat ccg cgc ggg ccg gtg 

Val Asn Leu Glu Val" Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val 
x 5 10 1 ^ 

ate acg gtg gtc ggc gcg tec age ttc ate ggg tec gec ctg gtc gec 
He Thr Val Val Gly Ala Ser Gly Phe He Gly Ser Ala Leu Val Ala 
2 0 2 5 3 0 

crag ctg gcg cgc atg ccg gtg egg ctg egg gcg gtg gec egg cgc gag 
Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu 
35 ^0 45 



43 



9 6 
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acc ccc gtt ccc gcg ggg gca egg gec gec gtc gag gtc cgc egg gcg 1S2 
Thr Pro Val Pre Ala Gly Ala Arg Ala Ala Val GIu Val Arg Arg Ala 
50 55 60 

gae etc gee egg ccg gae gag gte ggg gec gec gtc gag ggg gcg gae 2 40 
Asp Leu Ala Arg Pro Asp GIu Val Gly Ala Ala Val Glu Gly Ala Asp 
65 70 75 80 

gec gtc " gtg cae " etc 'gee" gec "cae etegge ggc "gcg— egg "teg ~ tgg cgc ■ 2 88 
Ala Val Val His Leu Ala Ala His lie Gly Gly Ala Arg Ser Trp Arg 
85 90 95 

gcg gee gae gag egg teg ctg egg gtg aac gtc ggt ctg ctg cge gae 33 6 
Ala Ala Asp Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu A.rg Asp 
100 1C5 110 

gtg gec gae gcg ttc egg gae cgc teg ggg ccc gec ccg gee gtg gtc 3 84 
Val Ala Asp Ala ?he Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val 
115 120 125 

ctg gec agt acc etc cag gee ggc gtc gag ctg tec egg cag ggc ccg 432 
Leu Ala Ser Thr Leu Gin Ala Gly Val Glu Leu Ser Arg Gin Gly Pro 
130 135 140 

tac gec egg cag aag teg gcg gec gag gag gtc ctg ctg egg gec gee 480 
Tyr Ala Arg Gin Lys Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala 
145 150 155 160 

tec gag gag gtg gtc cgc ggc gte gtg ctg egg ctg ccg acc gte tac 52 8 
Ser Glu GIu Val Val Arg Gly Val Val Leu Arg Leu Pro Thr Val Tyr 
165 170 175 

ggg cgc age ccg ctg ace ggg tgg acg ggc cgc ggg gtg gtc gcg teg 57 6 
Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser 
180 185 190 

gtg gea egg cag gee gtc teg ggc gag ccg gtc acg atg tgg cae gae 62 4 
Val Ala Arg Gin Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp 
195 200 205 

ggc acg gtc ggg cgc gat ctg etc cae gtg gag gae gcg gee cgc gee 67 2 
Gly Thr Val Gly Arg Asp Leu Leu His Val Glu Asp Ala Ala Arg Ala 
210 215 220 

ttc gcg gcg gcg etc ggt eac gtg gag egg ctg gae ggc ggc acg tgg 72 0 
?he Ala Ala Ala Leu Gly His Val GIu Arg Leu Asp Gly Gly Thr Trp 
225 230 235 240 

tec gtc ggt acg ggc egg ctg gag ccc ttg gga gag gtg ttc teg gee 7 68 
Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala 
245 250 255 

etc gee ggg ctg gtg gee gag egg acg ggg agg ccc ccc gta ccg gtg 816 
Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val 
260 265 270 

gtc tec acg gag ccg ccc gae cat gec gag gcg ggc gae ttc gag age S54 
Val Ser Thr GIu Pro Pro Asp His Ala Glu Ala Gly Asp Phe Glu Ser 
275 280 285 
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gcg gtc tgt gac ccc tec gcg etc cgc gcg gtg acc ggg tgg tct ccc S12 

Ala Val Cys Asp Pro Ser Ala ?he Arc Ala Val Thr Gly Trp Ser Pro 
290 295 300 

etc gtt cog ttg egg gcg ggg etc ggc gec gtg gtg gag acg atg gtg S60 

Leu Val Pro Leu Arg Ala Glv Leu Gly Ala Val Val Glu Thr Met Val 

3C5 310 315 320 

gee gac gga gcg agg ggt ggg arc cga acg tga 993 

Ala Asp Glv Ala Arg Gly Gly lie Arg Thr 
325 330 



<210> 73 
<211> 330 
<212> PRT 

<213> Streptomyces ambof aciens 
<40C> 73 

Val Asn Leu Glu Val Leu Asn Arg Ser Asn Asp Pro Arg Gly Pro Val 
15 10 15 

He Thr Val Val Glv Ala Ser Gly Phe He Gly Ser Ala Leu Val Ala 
20 25 30 

Glu Leu Ala Arg Met Pro Val Arg Leu Arg Ala Val Ala Arg Arg Glu 
35 40 45 

Thr Pro Val Pro Ala Gly Ala Arg Ala Ala Val Glu Val Arg Arg A. la 
50 5 5 6 0 

Asp Leu Ala Arg Pro Aso Glu Val Gly Ala Ala Val Glu Gly Ala Asp 
65 70 75 B0 

Ala Val Val His Leu Ala Ala His He Gly Gly Ala Arg Ser Trp Arg 
85 90 95 

»la &la Astd Glu Arg Ser Leu Arg Val Asn Val Gly Leu Leu Arg Asp 
100 105 HO 

Val Ala Asp Ala Phe Arg Asp Arg Ser Gly Pro Ala Pro Ala Val Val 
115 120 125 

Leu Ala Ser Thr Leu Gin Ala Gly Val Glu Leu Ser Arg Gin Gly Pro 
130 135 . % 140 

Tyr a la Arg Gin Lvs Ser Ala Ala Glu Glu Val Leu Leu Arg Ala Ala 
145 " 150 155 160 

Ser Glu Glu Val Val Ara Glv Val Val Leu Arg Leu Pro Thr Val Tyr 
165 170 175 

Gly Arg Ser Pro Leu Thr Gly Trp Thr Gly Arg Gly Val Val Ala Ser 
180 185 150 

Val Ala Arg Gin Ala Val Ser Gly Glu Pro Val Thr Met Trp His Asp 
155 2 00 205 

Glv Thr Val Gly Arg Aso Leu Leu His Val Glu Asp Ala Ala Arg Ala 
210 " 215 220 
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Phs Ala Ala Ala Leu Gly His Val Glu Arg Leu Asp Gly Gly Thr Trp 
225 23C 235 240 

Ser Val Gly Thr Gly Arg Leu Glu Pro Leu Gly Glu Val Phe Ser Ala 
245 250 255 

Leu Ala Gly Leu Val Ala Glu Arg Thr Gly Arg Pro Pro Val Pro Val 
260 265 270 



~Var _ Ser~ Thr~Gl"U~Pr o" ?r o^ Asp™ Hrs ^ra"G±u-A:ra- Gly— Asp- Phe-Glu -Ser 

275 2 BO 285 

Ala Val Cys Asp Pro Ser Ala ?he Arg Ala Val Thr Gly Trp Ser Pro 
290 295 300 

Leu Val Pro Leu Arg Ala Gly Leu Gly Ala Val Val Glu Thr Men Val 
305 310 315 320 

Ala Asp Gly Ala Arg Gly Gly lie Arg Thr 
325 330 



<210> 74 

<211> 1008 

<212> ADN 

<213> Streptomyces ambof aciens 

<220> 

<221> CDS 

<222> (1) . . (1008) 

<400> 74 

gtg age acg gac egg gag cag gec gcg cac acg egg etc ggt cgc age 4 8 
Val Ser Thr Asp Arg Glu Gin Ala Ala His Thr Arg Leu Gly Arg Ser 
15 10 15 

gcg ace ctg gtg age egg etc tgg ctg ggc aec gtg aac ttc age gge 96 
Ala Thr Leu Val Ser Arg Leu Trp Leu Gly Thr Val Asn Phe Ser Gly 
20 25 30 

egg gtc gag gac ggt gac gcg atg cag ctg atg gag gcg gcg gtc gac 144 
Arg Val Glu Asp Gly Asp Ala Met Gin Leu Met Glu Ala Ala Val Asp 
35 40 45 

cgc gge ate aac tgc ate gac ace gcg gac ate tac ggc tgg egg aec 192 
Arg Gly lie Asn Cys lie Asp Thr Ala Asp lie Tyr Gly Trp Arg lie 
50 55 60 

cac aag ggc cac ace gag gaa ctg gtg ggc egg tgg ctg gee aag age 240 
His Lys Gly Kis Thr Glu Glu Leu Val Gly Arg Trp Leu Ala Lys Ser 
65 70 75 80 

gec gcg egg egg gag gac gtc ctg ctg gee acc aag gtc gge ggg gac 2 88 
Ala Ala Arg Arg Glu Asp Val Leu Leu Ala Thr Lys Val Gly Gly Asp 
35 90 95 

atg age gaa egg etc aac gac ggc ggc ctg teg gcg egg cac ate gtc 33 6 
Met Ser Glu Arg Leu Asn Asp Gly Gly Leu Ser Ala Arg His lie Val 
100 105 110 
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acc gcc tgc gag cag ccg ctg egg cgc etc ggc g g gac ca. aU *a. 
^ Ala Cvs Glu Gin Ser Leu Arg Arg Leu Gly Val Asp His ne A*p 
115 -20 I 2 - 



eta tac cag atg cac cgc gtc gac cac gcc gcg ccg egg gac gag ate 
Tvr Gin Met His Arg Val Asp His Ala Ala Pro Trp Asp Glu ue 
130 135 1" 



3 84 



432 



too caa gcg atg gac cgc ctg gtg gcg age ggc aag gtg acc g,g 48C 

?4 Gin Ala Met Asp Arg Leu Val Ala Ser Gly Lys Val Tnr Tyr Val 
!45 150 155 -60 

aag teg teg aac ttc gcc ggc tgg aac gtc gcc gee gcg cag gac gcg 
Gly Ser Ser Asn Phe Ala Gly Trp Asn Val Ala Aia Ala G_n Asp Axa 
16 5 170 17d 

acc cag cga cac cag tec etc ggc ctg gtg tec gag cag tgc ctg tac 
Ala A-g Arg Arg Gin Ser Leu Gly Leu Val Ser Glu Gin Cys Leu Tyr 
180 185 190 

aac ctg acg gtg cgc cac gcc gag ctg gaa ctg ctg ccg gcc gcc cag 
Asn Leu Ala Val Arg His Ala Glu Leu Glu Leu Leu Pro Ala Ala Gin 
195 200 205 

acg tac gga ctg ggc gtg ttc gcc tgg teg ccg ctg cac ggc ggg ctg 
*ia Tyr Gly Leu Gly Val Phe Ala Trp Ser Pro Leu His Gly Gly Leu 
210 215 220 

etc aac aag gtg ctg cgc aag etc gcg gcg ggc gtc gcg gtg aag teg 
Leu S^r Glv Val Leu Arg Lys Leu Ala Ala Gly Val Ala Val Lys Ser 
225 ~ 230 235 240 

aca cag ggg egg gcc cag ctg ctg ctg ccc gag ctg cgc gcg acg ate 
Pla Gin Glv Arg Ala Gin Leu Leu Leu Pro Glu Leu Arg Ala Thr lie 
245 250 255 

aag gcg tac gag ggg ttc tgc ggc egg ate ggc gcg gat ccg gcc gag 
Glu Ma Tyr Glu Gly PhV Cys Gly Arg He Gly Ala Asp Pro Ala Glu 
260 265 270 

gtc ggt ctg gcc tgg gtg ctg tec egg ccg ggg ate age ggc gcg gtg 
Val Gly Leu Ala Tro Val Leu Ser Arg Pro Gly He Ser Gly Ala Val 
275 280 285 

ate ggc ccg cgc acg gtg gac cag ctg gac teg gcg ctg egg tec ctg 
He Gly Pro Arg Thr Val Asp Gin Leu AJsp Ser Ala Leu Arg Ser Leu 
290 295 300 

gac ctg gtc etc ggg gag gcc gaa ctg gcc gag ctg gac gcc ate ttc 
Asp Leu Val Leu Gly Glu Ala Glu Leu Ala Glu Leu Asp Ala He ?ne 
305 310 315 320 

ccg ccc ctg ggc aag ggc ggc egg gcg ccg gac gcg tgg ate age tga IOCS 
-3 ro p ro Leu Glv Lys Gly Gly Arg Ala Pro Asp Ala Trp He Ser 
325 " ' 330 335 



<210> 75 

<211> 335 

<212> ?RT 

<213> Streptoirryees smbof aciens 
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<40C> 75 

Val Ser Thr Asp Arg 
1 5 

Ala Thr Leu Val Ser 
20 

Arg Val Glu Asp Gly 

" " " 33 

Arg Gly lie Asn Cys 
50 

Kis Lys Gly His Thr 
65 

Ala Ala Arg Arg Glu 
85 

Met Ser Glu Arg Leu 
100 

Thr Ala Cys Glu Gin 
115 

J^eu Tyr Gin Met Kis 
150 

Trp Gin Ala Met Asp 
145 

Gly Ser Ser Asn ?he 
165 

Ala Arg Arg Arg Gin 
180 

Asn Leu Ala Val Arg 
195 

Ala Tyr Gly Leu Gly 
210 

Leu Ser Gly Val Leu 
225 

Ala Gin Gly Arg Ala 
245 

Glu Ala Tyr Glu Gly 
260 

Val Gly Leu Ala Trp 
275 

lie Gly Pro Arg Thr 

290 

Asp Leu Val Leu Gly 
3 05 



Glu Gin Ala Ala His Thr 
10 

Arg Leu Trp Leu Gly Thr 
25 

Asp Ala Met Gin Leu Met 

- - 40 

lie Asp Thr Ala Asp lie 
55 

Glu Glu Leu Val Gly Arg 
70 75 

Asp Val Leu Leu Ala Thr 
90 

Asn Asp Gly Gly Leu Ser 
105 

Ser Leu Arg Arg Leu Gly 
120 

Arg Val Asp Kis Ala Ala 
135 

Arg Leu Val Ala Ser Gly 
150 155 

Ala Gly Trp Asn Val Ala 
170 

Ser Leu Gly Leu Val Ser 
185 

His Ala Glu Leu Glu Leu 
200 

Val Phe Ala Trp Ser Pro 
215 

Arg Lys Leu Ala Ala Gly 
230 235 

Gin Leu Leu Leu Pro Glu 
250 

Phe Cys Gly Arg lie Gly 
265 

Val Leu Ser Arg Pro Gly 
230 

Val Asp Gin Leu Asp Ser 

Glu Ala Glu Leu Ala Glu 
310 315 



Arg Leu Gly Arg Ser 
15 

Val Asn Phe Ser Gly 
30 

Glu Ala Ala Val Asp 

" ' ■ '45 

Tyr Gly Trp Arg lie 
60 

Trp Leu Ala Lys Ser 
80 

Lys Val Gly Gly Asp 
95 

Ala Arg His lie Val 
110 

Val Asp His lie Asp 
125 

Pro Trp Asp Glu lie 
140 

•Lys Val Thr Tyr Val 
160 

Ala Ala Gin Asp Ala 
175 

Glu Gin Cys Leu Tyr 
190 

Leu Pro Ala Ala Gin 
205 

Leu His Gly Gly Leu 
220 

Val Ala Val Lys Ser 
240 

Leu Arg Ala Thr lie 
255 

Ala Asp Pro Ala Glu 
270 

He Ser Gly Ala Val 
2S5 

Ala Leu Arg Ser Leu 
300 

Leu Asp Ala He Phe 
320 
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D ro ^ro Leu Giy I.vs Gly Glv Arg Ala Pro Asp Ala Trp lis Ser 
325 330 335 



<210> 76 
<211> 1233 
<212> ADN 

<213> Streptomyc.es ambof aciens 

<220> 

<221> CDS 

<222> (1) . - (1233) 

<£00> 76 

atg att acc acc gcg tgc cgc gtc tgc ggc aac aag gag eg etc ucc 

Met He Ala Thr Ala Cvs Arg Val Cys Gly Asn L-ys Glu Leu Leu Ser 

1 5 10 ^ 

ata etc gac eta ggc gaa cag gcg etc acc ggg gtg ttc ccg gee gac 
Val Leu Aso Leu Gly Glu Gin Ala Leu Thr Gly Val Phe Pro Ala Asp 
20 25 30 

cgc gac gag gtc gtg ccg teg gtc ccg ctg gaa etc gtc gcg tgt tee 
Arg Asp Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser 
3 5 40 4o 

ccg acc gga tac ggc etc gtg caa ctg cgc cac acc ccc gac ccg gac 
Pro Ala Gly Cys Gly Leu Val Gin Leu Arg His Thr Pro Asp Pro Asp 
50 55 60 

etc atg tac ggc gag ggc tac ggc tac cgc teg ggc ate egg ccc ttc 
Leu Met Tyr Glv Glu Gly Tyr Gly Tyr Arg Ser Gly xle Arg Pro Phe 
65 " 70 75 80 

atg gtc gac cac ctg cat ggc aag gtc gec gee gtc cgc egg ctg gtg 
Met Val Aso His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val 
85 90 95 

gac etc ggc ccg gac gac ctg gtc etc gac ate ggc age aac gac gee 
Aso Leu Gly Pro Asp Asp Leu Val Leu Asp He Gly Ser Asn Asp Ala 
100 105 HO 

acg etc etc aag ggc tac ccc gec gac ggc ccg cga ctg gtc ggc ate 
Thr Leu Leu Lys Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly ile 
115 120 125 

gac ccg acc ggc ggc aag ttc cgc gac ctg tac ccg ccg aac gec gag 
Asp Pro Thr Glv Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu 
130 135 140 

ttg gtc gtg gac tac ttc acc cgc gcg acc ttc gag aac cgc ttc ggg 
Leu Val Val Asp Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly 
14 5 150 15 5 1^0 

gcg egg egg gcg aag gec gtc acc tec ate gcg atg etc tac gac c~g 
Ala Arg Arg Ala Lys Ala Val Thr Ser lie Ala Met Phe Tyr Asp Leu 
155 170 17d 



48 



96 



144 



192 



240 



288 



336 



3S4 



432 



480 



ccg gac ccg ctg cgc ttc atg age gac gtc cgc ge 



etc etc gec gag 57 5 
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Pro Aso ^ro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu 
180 185 150 

gac gac gtc tgg atg atg gag cag age tac ctg ccc gee atg cte gaa 
Asp Gly Val Tr-D Men Met: Glu Gin Ser Tyr Leu Pro Ala Met Leu Glu 
195 200 205 

ace gac acg tac gac ate gtc tgc cac gag cac ctg gag tac cac gcg 
Ala Asp Ala Tvr Asp lie Val Cys Kis Glu His Leu Glu Tyr Tyr Ala 
^" r - 210 215 22 0 

eta cgc cag ate gag tgg atg gcg gaa cgc gtc ggc etc ace gtc ate 
L~u Arq Gin lie Glu Trp Met Ala Glu Arg Val Gly Leu Tnr Val lie 
225 " 230 235 240 

ego gec gaa etc ace gag gtg tac ggc ggc age ctg tgc gtc acg etc 
Ara Ala Glu Leu Tnr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr ,eu 
245 250 2 ^ 

gee aag acc ggt tec egg cac ccg agg gac gag gcg ggc ctg gee cgc 
Ha *ra Thr Gly Ser Arg Kis Pro Arg Asp Glu Ala Gly Leu Aia Arg 
260 265 270 

ate cag acc acc gag gee gee gcg gga ctg gac ggc atg oca ccg ttc 
lie Ara Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro ?ne 
275 280 285 

aag gee tec gee cgc cgc gtc gee gac cag egg gac gee ctg cgc ggc 
Glu Ala Phe Ala Arg Arg Val Ala Asp Gin Arg Asp Ala Leu Arg Gly 
290 295 300 

ttc eta gac cac tec cgc caa gag ggc ctg ctg acc etc ggg tac ggc 
^he Leu Aso Arg Ser Arg Gin Glu Gly Leu Leu Thr Leu Gly Tyr Gly 
305 " ' 310 315 320 

acc tec acc aag ggc aac gtc ate etc cag tac tgc ggg ate acc gaa 
Ala Ser T»hr Lvs Gly Asn Val lie Leu Gin Tyr Cys Gly He Thr Glu 
325 330 335 

coo aac eta ccg tgc ate ggc gag gtg age gag gag aag gcg ggg cgt 
Arg Asp Leu Pro Cys He Gly Glu Val Ser Glu Glu Lys Ala Gly Arg 
340 345 350 

ttc acc ccc ggg acg ggc ate ccc ate gtg tec gag gag gac gcg aag 
Phe Thr Pro Gly Thr Gly He Pro He Val Ser Glu Glu Asp Ala Lys 
355 360 365 

gcg cag aag ccg gac cag ttg ctg gtc ctg ccc tgg ate tac egg gac 
Ala Gin Lvs Pro Asp Gin Leu Leu Val Leu Pro Trp He Tyr Arg Asp 
370 375 380 

agg ttc ate gaa egg gag egg gag ttc etc gac ggc ggc ggc cga ctg 
Gly *h<=> Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu 
385 390 395 400 

gtc ttc ccg czg ccc gcg etc gac gtc gtg tga 
Val Phe Pro Leu Pro Ala Leu Asp Val Val 
405 410 



624 



672 



720 
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864 
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960 
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1233 



<210> 77 
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<211> 410 
<212> PRT 

< 2 1 3 > Streptowces ambofaciens 



<40C> 77 

Met lie' Ala Thr Ala Cys Arg Val Cys Gly Asn Lys Glu Leu beu »er 
1 



5 10 15 



Val Leu Asp Leu Gly Glu Gin Ala Leu Thr Gly Val Phe Pro Ala Asp 

20 25 30 

irg Aso Glu Val Val Pro Ser Val Pro Leu Glu Leu Val Ala Cys Ser 

~ 35 40 45 



Pro Ala Gly Cys 
50 



Glv Leu Val Gin Leu Arg His Thr Pro Asp Pro Asp 
5 5 6 0 



Leu Met Tvr Glv Glu Gly Tyr Gly Tyr Arg Ser Gly He Arg Pro Phe 
65 " 70 75 80 

Met Val Asd His Leu His Gly Lys Val Ala Ala Val Arg Arg Leu Val 
85 90 95 

Aso Leu Gly Pro Asp Asp Leu Val Leu Asp He Gly Ser Asn Asp Ala 
100 105 HO 

Th^ Leu Leu Lvs Gly Tyr Pro Ala Asp Gly Pro Arg Leu Val Gly He 
115 120 I 25 

Asp ^ro Thr Glv Gly Lys Phe Arg Asp Leu Tyr Pro Pro Asn Ala Glu 
130 135 140 • 

Leu Val Val Asr> Tyr Phe Thr Arg Ala Thr Phe Glu Asn Arg Phe Gly 
145 150 155 160 

21a *rg Arg Ala Lys Ala Val Thr Ser lie Ala Met Phe Tyr Asp Leu 
165 170 175 

z) ro Asp Pro Leu Arg Phe Met Ser Asp Val Arg Asp Val Leu Ala Glu 
130 1S5 190 

*so Gly Val Tro Met Met Glu Gin Ser Tyr Leu Pro Ala Met Leu Glu 
135 200 205 

* la Asp Ala Tvr Asr> He Val Cys His Glu His Leu Glu Tyr Tyr Ala 
210 215 220 

Leu a r g Gin lie Glu Tro Met Ala Glu Arg Val Gly Leu Thr Val He 
225 " 230 • 235 240 

*rg ^ la Glu Leu Thr Glu Val Tyr Gly Gly Ser Leu Cys Val Thr Leu 
245 2 50 2 55 

Ala Arg Thr Glv Ser Arg His Pro Arg Asp Glu Ala Gly Leu Ala Arg 
2 60 265 2/0 

He *ro Ala Ala Glu Ala Ala Ala Gly Leu Asp Gly Met Ala Pro Phe 
275 280 235 

Glu Ala Phe Ala Arg Arg Val Ala Asp Gin Arg Asp Ala Leu Arg Gly 
230 295 300 
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-be Leu Asp Arg Ser Arg Gin Glu Gly Leu Leu Thr Leu Gly Tyr Gly 
305 310 315 



Ala Ser Thr Lys Gly Asn Val lie Leu Gin Tyr Cys Gly He Thr Glu 
325 



330 335 



^so Leu Pro Cys He Gly Glu Val Ser Glu Glu Lys Ala Gly Arg 
" ' 340 345 350 



-he i*hr- x^o Qlv Thr Gly He Pro He Val Ser Glu -Glu Asp Ala Lys 
355 360 3b5 

Ha Gin Lvs Pro Asp Gin Leu Leu Val Leu Pro Trp He Tyr Arg Asp 
370 3^5 380 

Gly Phe Val Glu Arg Glu Arg Glu Phe Leu Asp Gly Gly Gly Arg Leu 



385 



3 9 0 3 9 5 



Val -be -ro Leu Pro Ala Leu Asp Val Val 
405 ^0 



<21C> 78 

<211> 1116 

<212> ADN 

<213> Streptoinyces airibof aciens 

<220> 

<221> CDS 

<222> (1) . . (1116) 

<400> 78 ^ 
g^a cac cag gac aac gcc gcc gag ccg ttg gtc aaa tgc ctg g^c ugg 
Val F^s Arg Asp Asn Ala Ala Glu Pro Leu Val Lys Cys Leu Val Trp 
15 10 15 

gac ccg gac aac acc etc tag cag ggc acc etc etc gag gag gac gag 
z-.so Leu Asp Asn Thr Leu Trp Gin Gly Thr Leu Leu Glu Glu Asp Glu 
20 25 30 

ate egg etc gcc ccg gac gtc ctg egg acc ate acc gag ctg gac gcg 
Val Arg Leu Ala Pro Asp Val Leu Arg Thr He Thr Glu Leu Asp Ala 
35 40 45 

cac aac ate ctg cag gcg gtg gcc age aag aac gac cac gat cac gcc 
A^g Gly He Leu Gin Ala Val Ala Ser Lys Asn Asp His Asp His Ala 
50 55 50 

tga gcg aag etc gaa cag etc ggc gtc gcc gag tac ttc gtg etc ccg 
Tr 0 a la Lys Leu Glu Gin Leu Gly Val Ala Glu Tyr Phe Val Leu Pro 
~65 " 70 75 80 

aaa ate ggc tag ggc ccg aag teg aag teg gtc cgc gag ate gcc gac 
He Glv Ttd Glv Pro Lys Ser Lys Ser Val Arg Glu He Ala Asp 
85 90 95 

coo ctg aac ttc gcg ccg age acc etc gcc ttc ate gac gac cag ccc 
>rg L~u Asn *>he A3 a Pro Ser Thr Leu Ala Phe lie Asp Asp Gin Pro 
100 105 HO 



48 



S6 



144 



192 



240 



288 



ll 

'1 
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ttc aaa egg acc gag gtc acc cac gaa ctg ccg gag grc cgc acc .ac 
v'n~ Glu \rc >la Glu Val Thr His Glu Leu Pro G-iu Vai Arg Tnr .yr 

120 125 



lis 



acc acc gag cag gcg acc egg ctg acc ggc etc ccg gag ttc age ccg 
Ala *ia Glu Gin Ala Thr Arg Leu Thr Gly Leu Pro Glu Pne Ser Pro 
130 135 1^0 

gac acc gtc acc gtc gae teg ace cgc cgc cgc tec atg tac cag gcg 
Glv ^ r Val Thr Val Aso Ser Thr Arg Arg Arg Ser Met Tyr olr. i^a 
14 " 5 150 155 ^0 

tec ttc cgc cag gae gec gag egg tec gac ttc ace gga ccc gac gcg 
s ^ Phe p-a Ara Aso Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp JLa 
~- - 16 - 5 1-7 0 1^5 

gac ttc ctg cgc teg ctg gac ate egg atg egg ate age cgc gee acg 
*so *he ^eu Arg Ser Leu Asp He Arg Met Arg He Ser Arg Ala Tnr 
* 180 185 190 

ccc eta gag eta teg egg gtc gag gaa ctg acc ctg cgc acc age cag 
Pro Leu Glu Leu Ser Arg Val Glu Glu Leu Thr Leu Arg Thr Ser Gin 
195 200 205 

-ta aac acc acc aga gtg cac tac tec gag gac gag ctg cgc gee etc 
Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu 
210 215 220 

ate gac gac ccc gac cac gag gtg ctg gtc acc acc gtc acc gat cgc 
I-e *so Aso Pro Aso His Glu Val Leu Val Thr Thr Val Thr Asp Arg 
225 " " " " " 230 235 240 

ttc gat ccc tac ggc gcg gtc ggc gtc gtg ctg ctg egg cgc ggc ccc 
Glv *ro Tyr Glv Ala Vai Gly Val Val Leu Leu Arg Arg Gly Pro 
245 250 2^5 

gag acc tag egg ate aag ctg ctg gee acc teg tgc egg gtg gtg teg 
Glu *""» a T^p Prg Tie Lys Leu Leu Ala Thr Ser Cys Arg Val Val Ser 
"260 " 265 270 

ctg crag gec aac acg gtg ate ctg cgc tgg ctg acg gac cag gcg cac 
Leu Gly Ala Gly Thr Val lie Leu Arg Trp Leu Thr Asp Gin Ala His 
275 280 285 

cag gee gag gtg cac etc gga gec gac ttc egg gec acc gaa cgc aac 
Arg Ala Gly Val His Leu Gly Ala Asp Phe Arg Ala Thr Glu Arg Asn 
290 295 300 

cog atg atg aaa gtg gec tac cgc ttc gee gga ttc acc gac gat ccc 
Arg Met Met Glu Val Ala Tyr Arg Phe Ala Gly Phe Thr Asp Asp Pro 
305 310 315 .320 

tac ccg tgc cag gac gee tec gec gee acc ggc gcg ate ggc cgc ctg 
rvs ^ro Cvs Gin Aso Ala Ser Ala Ala Thr Gly Ala He Gly Arg Leu 
325 330 335 

cac ctg gtg ccg tec ccc egg ccc gec ccc gac acc etc cgt ctg gaa 
wis Leu Val Pro Ser Pro Arg Pro Ala Pro Asp Thr Leu Arg Leu G_u 
340 345 3d0 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



S50 



1008 



1056 
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125 

act ccc aac ctg gee acg ggc egg egg egc ccc ggc cag gar ccc gaa 1104 
l la r> ro L,eu Ala Thr Gly Arg Arg Arc Pro Gly Gin Asp Pro Giu 

355 360 365 

1116 

agg acc cca ~ga 
Arg Thr Pro 
370 



<2TC"79 ™~ ~" — — 

<211> 371 
<212> PPvT 

<213> Streptomyees ambofaciens 

<4 0C> 7 9 -. 
Val His Arg Asp Asn Ala Ala Giu Pro Leu Val Lys Cys -eu JH I_p 
1 ~ 5 10 15 

*so Leu ^so Asn Thr Leu Trp Gin Gly Thr Leu Leu Giu Glu Asp Glu 
20 25 30 

Va i * rg Leu Ala Pro Asp Val Leu Arg Thr lie Thr Glu Leu Asp Ala 
35 ^0 ^ 

Pro Glv He Leu Gin Ala Val Ala Ser Lys Asn Asp His Asp His Ala 
50 55 60 

Tro Ala Lvs Leu Glu Gin Leu Gly Val Ala Glu Tyr Phe Val Leu Pro 
65 70 75 B0 

Ara He Glv Trp Glv Pro Lys Ser Lys Ser Val Arg Glu He Ala Asp 
85 90 5 5 

Ara Leu Asn Phe Ala Pro Ser Thr Leu Ala Phe lie Asp Asp Gin Pro 
100 105 HO 

*>he Glu Arcr Ala Glu Val Thr His Glu Leu Pro Glu Val Arg Thr Tyr 
115 120 125 

a la Ala Glu Gin Ala Thr Arg Leu Thr Gly Leu Pro Glu Phe Ser Pro 
130 135 1^0 

Glv Thr Val Thr Val Asp Ser Thr Arg Arg Arg Ser Met Tyr Gin Ala 
145 150 155 160 

Ser ^he Arg Arg Aso Ala Glu Arg Ser Asp Phe Thr Gly Pro Asp Ala 
165 170 175 

i^P rrn~ Leu Ara Ser Leu Aso He Arg Met Arg lie Ser Arg Ala Thr 
180 185 150 

Pro Leu Glu Leu Ser Arg Val Giu Glu Leu Thr Leu Arg Thr Ser Gin 
1S5 200 20b 

Met Asn Ala Thr Gly Val His Tyr Ser Glu Asp Glu Leu Arg Ala Leu 
210 215 * 220 



He Aso Aso Pro Aso Kis Glu Val Leu Val Thr Thr Val Thr Asp Arg 
225 230 ' 235 . 240 

Phe Gly Pro Tyr Gly Ala Val Gly Val Val Leu Leu Arg Arg Gly Pro 
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Giu Ala Trp Arg 
260 

Leu Gly Ala Gly 
275 

Arg Ala Gly Val 
290 

Arg Met Met Glu 
305 

Cys Pro Cys Gin 



Kis Leu Val Pro 
340 

Ala Pro Asp Leu 
355 

Arg Thr Pro 
370 



245 

lie Lys Leu Leu 



Thr Val .tie Leu 
280 

His Leu Gly Ala 
295 

Val Ala Tyr Arg 
310 

Asp Ala Ser Ala 
32 5 

Ser Pro Arg Pro 



Ala Thr Gly Arg 
350 



250 

Ala Thr Ser Cys 
265 

Arg Trp Leu Thr 



A so ?he Arg Ala 
300 

Phe Ala Gly Phe 
315 

Ala Thr Gly Ala 
330 

Ala Pro Asp Thr 
345 

Arg Arg Pro Gly 



255 

Arg Val Val Ser 
270 

Asp Gin Ala His 
285 

Thr Glu Arg Asn 



Thr Asp Asp Pro 
320 

lie Gly Arg Leu 
335 

Leu Arg Leu Giu 
350 

Gin Asp Pro Giu 
365 



<210> 80- 
<211> 1122 
<212> ADN 

<213> Streptomyces ambofaciens 

<220> 

<221> CDS 

<222> (i) . - (1122) 

<400> 80 

ate get aac acc tec cac gec gac ggc acc gag gee gag gag ctg t^c 

Val * n a Asx> Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe 

x 5 10 15 

acc gcg ctg gtc ggc gac egg gcg gec gag tgg gac egg acg ggc gag 
Thr *-la Leu Val Gly Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu 
20 25 t 30 

eta ccc etc age ctg ctg cac gac etc ggc tec egg ggc ctg ctg tgc 
Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys 
35 " 40 45 

oca cag acg ccc gcg gtc cac ggc ggc etc ggc tgg acc age egg cgc 
Ala Gin Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg 
50 55 60 

aac age gaa etc acc gcg cac gtc ggc gec etc tgc age teg ttg egg 
*,sn Glv Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg 
*65 " 70 75 B0 

aac acc atg acc teg cag ggc atg gec gec tgg acg ctg cgc egg etc 
S~r V*l M^" Thr Ser Gin Glv Met Ala Ala Trp Thr Leu Arg Arg Leu 
35 50 55 



48 



144 



192 



240 



^83 



1er depot 

127 



gcc gga gcg gac cag cag gcc tec ctg gtg ccc egg teg aec ggc ggc 3? 6 
Ala Gly Ala Asp Gin Gin Ala Ser Leu Val Pro Arg Leu Thr Gly Gly 
100 105 110 

gaa ctg gee gcc gtg gcg ttc ace gag gcc gge gcc ggc age gac ctg 3 84 
Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser Asp Leu 
115 120 125 

tec gcc " ~c t g "cgc "a'cc" cgc" ate acc "tec ~gac "gge ga c gaa gre gtc gt c~~ - ~4 3 2 
Ser Ala Leu Arg Thr Arg He Thr Ser Asp Gly Asp Glu Val Val Val 
130 135 140 

gac ggc gtc aag gtg tgg gcg acc aac gcc gcg tac gcg gac ctg ctg 480 
Asp Gly Val Lys Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu 
145 150 155 160 

gtg gtc ttc ggc cgc acg gag cag ggc gcg ggc gcc gtc gtg gtg ccc 52 8 
Val Val Phe Gly Arg Thr Glu Gin Gly Ala Gly Ala Val Val Val Pro 
165 170 175 

gcc teg gcc ccc ggc gta cgc gtc gag cgc ate acc gac gcg cac ggc 576 
Ala Ser Ala Pro Gly Val Arg Val Glu Arg He Thr Asp Ala His Gly 
180 185 190 

tgc cgc gcg gcc gga cac gcc gac ate cac ctg gac ggg gtc egg ctg 62 4 
Cys Arg Ala Ala Gly His Ala Asp lie Kis Leu Asp Gly Val Arg Leu 
195 200 205 

ccg gca gac gcc ctg etc cag ggc cac gac cgc acc ccc gcc ctg ctg 672 
Pro Ala Asp Ala Leu Leu Gin Gly His Asp Arg Thr Pro Ala Leu Leu 
210 215 220 

gtc acc acc gcg ctg age tac ggc egg atg teg gtg gcc tgg ggc tec 72 0 
Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser 
225 230 235 240 

ctg ggc ate ctg cgc gcc tgc ctg gcc gee gee gca cgt cac gcc ggc 768 
Leu Gly lie Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg Kis Ala Gly 
245 250 255 

gga egg gag cag ttc ggc acg egg etc teg gac cac cag etc gtc gcc 816 
Gly Arg Glu Gin Phe Gly Thr Arg Leu Ser Asp Kis Gin Leu Val Ala 
260 265 270 

egg cac etc gcc gaa ctg ttc gtc gee gaa cag cac gcc gcc egg gcg 864 
Arg Kis Leu Ala Glu Leu Phe Val Ala Glu Gin Kis Ala Ala Arg Ala 
275 280 285 

tgc gag cac gcc age gcc cag tgg gac gag ggc age ccc gac atg gtg 912 
Cys Glu Kis Ala Ser Ala Gin Trp Asp Glu Gly Ser Pro Asp Met Val 
290 295 300 

gtc gcc gcc gtc ctg gcc aag cac gtc gcg gcc acc ggc gcc gca cgc 960 
Val Ala Ala Val Leu Ala Lys Kis Val Ala Ala Thr Gly Ala Ala Arg 
305 310 315 320 

•ggg gcc gaa egg gcc gtg cag gtg ctg gcg teg gcc ggg gcg egg gag 100 8 
Gly Ala Glu Arg Ala Val Gin Val Leu Ala Ser Ala Gly Ala Arg Glu 
325 330 335 
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gaa cac gtc gtc gca egg gcg cac cgc ga, gec aag etc atg gag ate 1056 

Glv His Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu ue 
340 345 3d0 

ate gag gge age aae gag ate tgc gaa etg gtc eta gee egg cac gtg 1104 

II- Glu Glv ser Asn Glu lie Cys Glu Leu Val Leu Ala Arg h. a Va, 
355 360 365 



atg tec gcg gee ggg tga 
Met Ser Ala Ala Gly 
370 



<210> 81 
<211> 373 
<2I2> ?RT 

<213> Streptomyces antbof aciens 
<400> 81 

Val Ala Asn Thr Ser His Ala Asp Gly Thr Glu Ala Glu Glu Leu Phe 
x 5 10 15 

Thr Ala Leu Val Glv Asp Arg Ala Ala Glu Trp Asp Arg Thr Gly Glu 
20 25 30 

Leu Pro Leu Gly Leu Leu His Asp Leu Gly Ser Arg Gly Leu Leu Cys 
35 40 45 

Ala Gin Ala Pro Ala Val His Gly Gly Leu Gly Trp Thr Ser Arg Arg 
50 55 60 

Asn Gly Glu Leu Thr Ala His Val Gly Ala Leu Cys Ser Ser Leu Arg 
65 70 75 80 

Ser Val Met Thr Ser Gin Glv Met Ala Ala Trp Thr Leu Arg Arg Leu 
85 90 95 

Ala Gly Ala Aso Gin Gin Ala Ser Leu Val Pro Arg Leu Thr Gly Gly 
100 105 110 

Glu Leu Ala Ala Val Ala Phe Thr Glu Ala Gly Ala Gly Ser A.sp Leu 
115 120 125 

Ser Ala Leu Arg Thr Arg lie Thr Ser Asp Gly Asp Glu Val Val Val 
130 ~ 135 140 

Asp Glv Val Lvs Val Trp Ala Thr Asn Ala Ala Tyr Ala Asp Leu Leu 
145 ~ 150 155 160 

Val Val Phe Gly Arg Thr Glu Gin Gly Ala Gly Ala Val Val Val Pro 
165 170 175 

Ala Ser Ala Pro Gly Val Arg Val Glu Arg He Thr Asp Ala His Gly 
180 185 150 

Cys Arg Ala Ala Gly His Ala Asp He His Leu Asp Gly Val Arg Leu 
195 200 205 

Pro Ala A so Ala Leu Leu Gin Gly His Asp Arg Thr Pro Ala Leu Leu 
210 215 220 



.122 
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Val Thr Thr Ala Leu Ser Tyr Gly Arg Met Ser Val Ala Trp Gly Ser 
225 230 235 240 

Leu Gly He Leu Arg Ala Cys Leu Ala Ala Ala Ala Arg His Ala Gly 
245 250 255 

Gly .Arg Glu Gin Phe Gly Thr Arg Leu Ser Asp His Gin Leu Val Ala 
260 265 270 

275 280 285 

Gys Glu His Ala Ser Ala Gin Trp Asp Glu Gly Ser Pro Asp Met Val 
290 295 300 

Val Ala Ala Val Leu Ala Lys His Val Ala Ala Thr Gly Ala Ala Arg 
305 310 315 320 

Gly Ala Glu Arg Ala Val Gin Val Leu Ala Ser Ala Gly Ala Arg Glu 
325 330 335 

Gly Kis Val Val Ala Arg Ala His Arg Asp Ala Lys Leu Met Glu He 
340 ,345 350 

He Glu Gly Ser Asn Glu He Gys Glu Leu Val Leu Ala Arg His Val 
355 360 365 

Met Ser Ala Ala Gly 
370 



<210> 82 

<21i> 312 

<212> ADN 

<213> Streptomyces arcboiaciens 

<220> 

<221> CDS 

<222> (1) . . (312) 

<400> 82 

atg acc acg acg tec ggt egg ccc gac ccc acc ggc acg acc ccc acc 48 
Met Thr Thr Thr Ser Gly Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr 
15 10 15 

gec gac gag gtc gec ggg gaa ctg etc ggg ttc etc gag gac cgc acc 9 5 
Ala Asp Glu Val Ala Gly Gin Leu Leu Gly Phe Leu Glu Asp Arg Thr 
20 25 30 

aag acc acc tgg gag cgc gac cag gac ctg ttc gec gtc ggc ggg atg 144 
Lys Thr Thr Trp Gin Arg Asp Gin Asp Leu Phe Ala Val Gly Gly Met 
35 40 45 

tec teg ctg ttc gec atg cag etc gtc gtg cac ctg gag aag acc tac 192 
Ser Ser Leu Phe Ala Met Gin Leu Val Val His Leu Glu Lys Thr Tyr 
50 55 60 

ggc ate gtc ate age ggc gec gac ctg acg etc gac aac tec cgc acc 240 
Giy He Val He Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr 
65 70 75 SO 
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c^c aac gcg atg gtc egg ctg gtc gga egg ccg gee gcg ccc ggc gag 2 88 
Val Ast> Ala Me: Val Arg Leu Val Gly Arg Leu Ala Ala Pro GJ.y Glu 
85 90 95 



312 



gcg acc ggg eac gca ggt ggc Lga 
Ala Tar Gly His Ala Gly Gly 
100 



<210> S3 
<211> 103 
<212> PRT 

<213> Streptoir.yces ainbofaciens 

2lt°^ 3f *ir Thr Ser Glv Arg Pro Asp Pro Thr Gly Thr Thr Pro Thr 

Pla Asp G"u Val Ala Glv Glu Leu Leu Gly Phe Leu Glu Asp Arg Thr 
20 25 30 

Lvs ^h^ Tnr Trr> Glu Arg Asp Gin Asp Leu Phe Ala Val Gly Gly Met 
35 40 45 

Ser Ser Leu Phe Ala Met Gin Leu Val Val His Leu Glu Lys Thr Tyr 
5 0 5 5 60 

Glv val lie Ser Gly Ala Asp Leu Met Leu Asp Asn Phe Arg Thr 

65 ~ 70 75 80 

Val AST) Ala Met Val Arg Leu Val Gly Arg Leu Ala Ala Pro Gly Glu 
85 90 55 

Ala Thr Gly His Ala Gly Gly 
100 



<210> 64 
<211> 867 
<212> ADN 

<2 13> Streptoir.yces ambefaciens 

<22C> 

<221> CDS 

<222> (1) . . (867) 

<400> 84 

gtg ccc gat tec aag gaa aat tct ccg etc gtc gtg etc ggc gcg ggc 4 8 

Val ^o iso Ser Lvs Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly 
1 ~5 10 15 

crtc atg aac acg gee ate gcg gca etc gee gtc gga eac ggg eac ccg 3 6 
v a i (Tv T*r Ma lie Ala Ala Leu Ala Val Gly Kis Gly His Pro 

20 25 30 



etc aca ctg gtc gae acc tec gee ggg gcg cgc gcg gee gee ccc gac 
Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp 



144 
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240 



gcg gtc gcg ccg cat ctg egg acg gec egg cog atg ggc gcg ccg ccc 192 
Ala Val Ala Leu His Leu Arg Thr Ala Arg Leu Hez Gly Ala Leu Pro 
50 55 50 

cac aac cac ccg ccc ggg gag ctg acc gtc gag gag gcg ccg gee gec 
wis Asd Arc Pro Pro Gly Glu Leu Thr Val Glu Glu Ala Pro Ala Ala 
~ 65 ~ " 70 75 SO 

ate gee acc gcg acc gec gtg acc gag gec gtc acc gag gac ccc gag 21 

-^al~>Ta-Tnr-Ala -Thr-Ala--Va± -Il-e-Gl-u-A-l-a^Val---T-fer--Gl-u- Asp-Rr-o_-G-U 

85 — 90 ^5 

ego aag gec aag gtg ctg gcg gac ctg gcg tec gtg gcg cgc ccg ggg. 3: 
A-g Lys Ala Glu Val Leu Ala Asp Leu Ala Ser Val Ala Arg Pro G_y 
100 105 HO 

acg ctg etc gtc age aac acc teg ggc gtc ccc ate gac gag ctg gee 
T'nr Leu Leu Val Ser Asn Tnr Ser Gly Val Pro lie Asp Glu i-eu A_a 
115 120 125 

gac gee ate ccc cgc ccc gag gac etc gtc ggc gtg cac tec atg aac 
Asp Ala Val Pro Arg Pro Glu Asp Leu Val Gly Val His Phe Met Asn 
130 135 140 

ccc gcg tac atg ate ccc acg gtc gag gtg gtc etc gga ccg cgc age 
u-o Ala Tyr Val He Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser 
145 " 150 155 160 

aga aag acg gec gec egg gec acc egg gac ctg ctg tec ggc ctg ggc 
Gly Glu Ala Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly 
165 170 175 

cac egg ggc ate gtc gtc ggc gac ggc gec ggc ttc gtg acc age cgc 
Arg Arg Gly He Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg 
ISO 185 130 

ctg ctg cac egg atg ctg aac gac gee ate gcg gtg gtg cac gag ggc 
Leu Leu His Arg Met Leu Asn Asp Ala He Ala Val Val His Glu Gly 
195 200 2C5 

egg gec acc ccg gag acc gtg gac gcg ctg atg cgc gac tgc ate ggc 
Arg Ha Thr Pro Glu Thr Val Aso Ala Leu Met Arg Asp Cys He Gly 
210 215 220 



aac 



gac cgc aag age ggc egg gga ttc tac gac tac cag gag gec acg cga 
Glv Arg Lvs Ser Glv Arg Glv Phe Tyr Asp Tyr Gin Glu Ala Thr Arg 
275 280 235 

tga 



3 84 



432 



480 



528 



576 



624 



672 



720 



cac cac acc gga ccc ctg gec acg gee gac ctg ate gga ctg gac 

^is hra Thr Gly Pro Leu Ala Thr Ala Asp Leu He Gly Leu Asp Asn 

225 " . 230 235 240 

ctg acc gac teg ctg egg gtg atg cac gaa egg acc ggc gat ccg gcg 7 68 

Leu Ala Aso Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala 

245 250 255 

etc cgc ccg age gag ctg ctg ctg gac aag gtc cgc cag ggc ctg etc 816 

Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gin Gly Leu Leu 

260 265 270 



864 
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<21C> 85 
<211> 288 
<212> PRT 

< 2 1 3 > Streptomyces ambof aciens 
<40C> 85 

Val Pro Asp Ser Lvs Glu Asn Ser Pro Leu Val Val Leu Gly Ala Gly 
1 5 10 I 5 

val M^t Glv Thr Ala lie Ala Ala Leu Ala Val Gly His Gly His Pro 
20 25 30 

Val Thr Leu Val Asp Thr Ser Ala Gly Ala Arg Ala Ala Ala Pro Asp 
35 40 45 

a la Val Ma Leu His Leu Arg Thr Ala Arg Leu Met Gly Ala Leu Pro 
50 55 60 

His ^? Arg Pro Pro Glv Glu Leu Thr Val Glu Glu Ala Pro Ala Ala 
65 " ~ 70 75 B0 

Val Ma ^hr a la Thr Ala Val He Glu Ala Val Thr Glu Asp Pro Glu 
85 90 95 

»rg Lys Ala Glu Val Leu ' Ala Asp Leu Ala Ser Val Ala Arg Pro Gly 
100 105 110 

•Thr Leu Leu Val Ser Asn Thr Ser Gly Val Pro He Asp Glu Leu Ala 
115 120 125 

Asp Ala Val Pro Arg Pro. Glu Asp Leu Val Gly Val His Phe Met Asn 
130 135 140 

o ro Ala Tyr Val He Pro Thr Val Glu Val Val Leu Gly Pro Arg Ser 
145 ~ 150 155 160 

Glv Glu £ la Ala Ala Arg Ala Thr Arg Asp Leu Leu Ser Gly Leu Gly 
165 170 175 

*-g A~g Glv He Val Val Gly Asp Gly Ala Gly Phe Val Thr Ser Arg 
130 185 130 

Leu Leu His Arg Met Leu Asn Asp Ala He Ala Val Val His Glu Gly 
195 200 205 

*^-g tla Thr Pro Glu Thr Val Asp Ala Leu Met Arg Asp Cys lie Gly 
210 215 220 

His Arg Thr Gly Pro Leu Ala Thr Ala Asp Leu He Gly Leu Asp Asn 
225 230 • 235 240 

Leu Ha Aso Ser Leu Arg Val Met His Glu Arg Thr Gly Asp Pro Ala 
245 250 2^5 

Leu Arg Pro Ser Glu Leu Leu Leu Asp Lys Val Arg Gin Gly Leu Leu 
250 265 270 

Glv Arg Lvs Ser Gly Arg Gly Phe Tyr Asp Tyr Gin Glu Ala Thr Arg 
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275 



285 



<210> 86 

<211> 1040 

<212> ADN 

<213> Streptomyces 



rracrae 



<400> 86 " 

ggcaggagcc 

-gcgggacgt 

tcgccgcgcg 

ccgagtactg 

tggcgcugtg 

tcatcgcgtc 

gtgatcccgg 

cgctgacccc 

tggacccggt 

aggccacggc 

tctacccggg 

cggaactcgc 

acgaggagcg 

agctgccgta 

aggcgctggc 

ggcatcagta 

cgggggtgga 

gcgcggggcc 



acccgtgaca 
gcacgcggcc 
cgggcgcuat 
cggcaacgcc 
ggcgctcggg 
ctggctcgcg 
cgagccgggg 
gcggaccagg 
cggggcgttc 
ccgttaccgc 
gaagaacctg 
ggaccggctig 
gggcaccaac 
cctggacgcc 
cggtctgccg 
cgtgctgcgc 
gaccctggtc 
gtgtcccgcc 



gggccgccgc 
acgg-gggtgg 
ctgctgggtg 
cactgtgtcg 
gtgggcgagg 
gtgtcggcga 
cccggggcgt 
gccgtgatgc 
gcggagccgc 
gggaggcgga 
ggcgcgctcg 
cggctgttgc 
tcccgcctgg 
tggaacaccc 
ggcgtcaccg 
agcccgtacc 
cactatccgg 



ggcccgccgt 
agt cggagat 
ccgaactcgc 
ccgtgggcag 
gcgacgaggt 
cgggtgccac 
tcctgctcga 
ccgtgcatct 
acgggctggc 
tcggcagcgg 
gcgacggcgg 
gcaactacgg 
acgagctgca 
gccgccggga 
tgccggaggg 
gcgaccggtt 
tggccgtgca 



ccgggtgcog 
cggcggcgcg 
cgcgtt.cgag 
cgggctcgac 
gatcgtgccc 
cccggcgccg 
cccggaccgg 
ctacgggcac 
cgtcgtggag 
ccaccgcacg 
tgccgtggtc 
cgcccgggag 
ggcggccgtg 
gatcgccgcc 
ccgcguggcg 
gcggcggcgg 
cgcgtcgggc 



ttccacgatc 
ctgctgcgcg 
gagcggt Leg 
gacgctcgtc 
tcgcacacgt 
gtcgagcccg 
ctggaggccg 
ccggtggatc 
gacgcggcgc 
gcgttcagct 
acctcggacc 
aagtacegge 
ctgtcggtca 
cgctacggcg 
gagceggtet 
ctggccgagg 
gegtacgegg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

72 0 

780 

84 0 

900 

960 

1020 

1040 



<210> 87 
<211> 388 
<212> PRT 

<213> Streptomyces fradiae 



<400> 87 

Mec Thr Glv Leu. Pro Arg Pro Ala Val Arg Val Pro Phe His Asp Leu 
1 " 5 10 15 

Arg Asp Val His Ala Ala Thr Gly Val Glu Ser Glu lie Glv Gly Ala 



20 



25 



30 



Leu Leu 



Arg Val Ala Ala Arg Gly Arg Tyr Leu Leu Gly Ala Glu Leu 



35 



40 



45 



Ala Ala Phe Glu Glu Arg Phe Ala Glu Tyr Cys Gly Asn Ala His Cys 



50 



55 



50 



Val Ala Val Gly Ser Gly Leu Asp Asp Ala Arg Leu Ala Leu Trp Ala 



65 



70 



75 



90 



95 



80 



Leu Gly Val Gly Glu Gly Asp Glu Val He Val Pro Ser His Thr Phe 



He Ala Ser Trp Leu Ala Val Ser Ala Thr Gly Ala Thr Pro Val Pro 



100 



.05 



110 



Val Glu Pro Gly Asp Pro Gly Glu Pro Gly Pro Gly Ala Phe Leu Leu 



115 



120 



125 



Asp Pro Asp Arg Leu Glu Ala Ala Leu Thr Pro Arg Thr Arg Ala Val 



1 er depot 

134 



130 

Met Pro Val His 
145 

Ala Phe Ala Glu 



Ala Thr Ala Arg 
180 

Ala Phe Ser Phe 
195 

Gly Ala Val Val 
210 

leu Arg Asn Tyr 
225 

Thr Asn Ser Arg 



Leu Pro Tyr Leu 
260 



135 

Leu Tyr Gly Kis 
150 

Pro His Gly Leu 
165 

Tyr Arg Gly Arg 



Tvr Pro Gly Lys 
2 0 0 

Thr Ser Asp Pro 
215 

Gly Ala Arg Glu 
230 

Leu Asp Glu Leu 
245 

Asp Ala Trp Asn 



140 

Pro Val Asp Leu 
15 5 

Ala Val Val Glu 
170 

Arg lie Gly Ser 
185 

Asn Leu Gly Ala 



Glu Leu Ala Asp 
220 

Lys Tyr Arg His 
23 5 

Gin Ala Ala Val 
250 L 

Thr Arg Arg Arg 
265 



Aso Pro Val Gly 
160 

Aso Ala Ala Gin 
175 

G-i-V His Arg Tnr 
190 

Leu Gly Asp Gly 
205 

Arg Leu Arg Leu 



Glu Glu Arg Gly 
240 

Leu Ser Val Lys 
255 

Glu lie Ala Ala 
270 



Arg Tyr Gly Glu .Ala Leu Ala Gly 
275 280 

Gly Arg Val Ala Glu Pro Val Trp 
290 295 

Tyr Arg Asp Arg Leu Arg Arg Arg 
305 ~ 310 

Leu Val His Tyr Pro Val Ala Val 
325 

Ala Gly Pro Cys Pro Ala Gly Gly 
340 

Gly Glu Val Leu Ser Leu Pro He 
355 360 

Val Glu Val Val He Ala Ala Val 
370 375 

Glu Glu Gly Pro 
385 



Leu Pro Gly Val Thr Val Pro Glu 
285 

His Gin Tyr Val Leu Arg Ser Pro 
300 

Leu Ala Glu Ala Gly Val Glu Thr 
315 320 

His Ala Ser Gly Ala Tyr Ala Gly 
330 335 

Leu Pro Arg Ala Glu Arg Leu Ala 
345 350 

Gly Pro His Leu Pro Asp Glu Ala 
365 

Gin Ser Ala Ala Leu Asp Ser Trp 
380 



<210> 83 
<211> 271 
<212> ?RT 

< 2 1 3 > S crept oirryces my car of aciens 
<40C> SS 

Met Ser Pro He Ser Ala Ser Ala Pro Ala Ala Ser Arg Ser Thr Ala 



1er depot 



135 



Arg Arg Glu Leu Gly Gin Asn ?he Phe Arg Ser Ala Ala Ala Ala Cys 
2 0 25 3 0 

Arg Phe Ser Asp Gin Leu Asp Ala Phe Cys Ala Asp Leu Pro Gly Ser 
35 40 45 

Leu Ala Asp Val Leu Thr Val Glu lie Gly Ala Gly Ser Gly Arg Val 
5C 55 60 

~Th^T,ys~ 

65 70 75 SO 

Asr> ^ la Tvr Trp Ala Ara Arg Leu Thr Ala Glu Ser Leu Pro Asp Val 
85 9 0 9 5 

Thr Val Val Asn Glu Asd Phe Leu Asn Leu Gin Leu Pro Arg Gin Pro 
100 105 HO 

lie Arg Leu lie Gly Asn Leu Pro Phe Val Ser Gly Thr Lys He Leu 
115 120 1 125 

Arg Arg Cys Leu Glu Leu Gly Pro Asn Arg Met Cys Gin Ala Val Phe 
130 ~ 135 140 

Leu Leu Gin Arg Glu Tyr Val Gly Lys Arg Thr Gly Ala Trp Gly Gly 
145 150 155 160. 

Asn Leu Phe Asn Ala Gin Trp Glu Pro Trp Tyr Thr Phe Glu Gly Gly 
165 170 175 

Leu Ala Phe Ser Arg Asn Glu Phe Ser Pro Val Pro Arg Ala Asp Thr 
180 1S5 190 

Gin Thr Leu Val Val Met Pro Arg Arg Arg Pro Ser Val Pro Trp Arg 
195 200 205 

Glu Arg Thr Asp Tyr Gin Arg Phe Thr Gin Gin He Phe Asp Thr Gly 
210 215 220 

Gin Met Thr He Gly Glu Ala Ala Arg Lys Val Leu Arg Arg Gly Kis 
225 230 235 240 

Ala Gin Phe Val Arg Ser Ala Gly Val Arg Pro Ala Asp Arg Val Lys 
245 250 255 

Asp Leu Thr Val Arg Asp Trp Ala Ala Leu Phe Arg Ala Asn Pro 
260 265 270 



<210> 89 
<211> 25 
<212> ADN 

<2 1 3 > Sequence arti f icielle 
<220> 

<22 3> Description de la sequence 

art if icielle: Oligonucleotide 3RMRI 

<40C> 89 

ctgccagtcc tctcccagca gtacg 



1er depot 
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<210> 90 



25 
ADN 



<213> Sequence 



irtif icielle 



<220> 

<222> Description de la sequence 

artif icielle : Oligonucleotide SR*1R2 



<400> 90 

tgaagctgga cgtctcctac gtcgg 



<21C> 91 
<211> 2755 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artifdcielle : Cassette 
exci sable 



<400> 91 

gatatctacc tcttcgtccc gaagcaactt 
ttctcacctg cggcgccagt ccatgggtgc 
tgtcacgcag ttagacactc accttcccac 
ccgcatgact gacagggatc cctcgagaag 
atttttaaaa taaaaaaggg gacctctagg 
aaaggtcatt caaaaggtca tccaccggat 
aagctctcgg gtaacatcaa ggcccgatcc 
gtgccgtgat cgaaatccag atccttgacc 
gtgagttagc tcactcatta ggcaccccag 
ttgtgtggaa ttgtgagcgg ataacaattt 
gccaagctgc ggtggcgtac accgtcgcct 
ccgcagcacc accgagaacg tccccgacgt 
accgcggtgc ggacaggccg tgtcgcgacc 
tgtgaataga ggtccgctgt gacacaagaa 
gatgattcct acgcgagcct gcggaacgac 
gccctggagg agctcgggct gccggtgccg 
aaccccgtac tggtcggcga gcccgacccg 
ggtccggaga gcctcgcgtc ggagtcggag 
ccggtgcccc gcctcctcgg ccgcggcgag 
ccctacctgg tgatgagccg gatgaccggc 
accgaccgga acgcgctgct cgccctggcc 
cacagggtgc cgctgaccgg gaacaccgtg 
ctgctgcggg aacgccgcgc ggcgaccgtc 
ccccggctgc tggaccgcct ggaggactgg 
cgcgaacccc ggttcgtcca cggcgacctg 
gcgaccgagg tcaccgggat cgtcgacttc 
agcctggtgc aactgcatct caacgccttc 
ctcgacgggg cgcagtggaa gcggaccgag 
ttcctgcacg acttcgaggt gttcgaggag 
ccggaggaac tggcgcagtt cctctggggg 
cccgggccgc ccggcgccgc ccccggcccc 
gggagccccg ggcccgcgcc gaagcccgct 
cggtgcgggc ccggcggcgg acgctcagca 
gatcatctcc tccagggtgg tcggccgagc 
cgcagatcag ttggaagaat ttgtccacta 
caaataatgt ctaacaatcc gttcaagccg 



gggtgggcgc tcgaccttgg gccagtgtgc 50 
tcgcggttgt ccgccgctgt gcgctggcgt 12 0 
gggcggtgtc gtagggctcg gctaagttgc 180 
ctttatgctt gtaaaccgtt ttgtgaaaaa 240 
gtccccaatt aattagtaat ataatctatt 300 
caattcccct gctcgcgcag gctgggtgcc 3 60 
ttggagccct tgccctcccg cacgatgatc 420 
cgcagttgca aaccctcact gatccgtaat 4 80 
gctttacact ttatgcttcc ggctcgtatg 540 
cacacaggaa acagctatga ccatgattac 600 
cggtcggccc gtagagattg gcgatcccga 650 
ggccgaccag cccgtcatcg tcaacgcctg 720 
ggccgtgcgg aattaagccg gcccgtaccc 7 80 
tccctgttac ttctcgaccg tattgattcg 840 
caggaattct gggagccgct ggcccgccga 9 00 
ccggtgctgc gggtgcccgg cgagagcacc 960 
gtgatcaagc tgttcggcga gcactggtgc 1020 
gcgtacgcgg tcctggcgga cgccccggtg 1080 
ctgcggcccg gcaccggagc ctggccgtgg 1140 
accacctggc ggtccgcgat ggacggcacg 12 00 
cgcgaactcg gccgggtgct cggccggctg 1260 
ctcacccccc attccgaggt cttcccggaa 1320 
gaggaccacc gcgggtgggg ctacctctcg 13 80 
ctgccggacg tggacacgct gctggccggc 1440 
cacgggacca acatcttcgt ggacctggcc 15 00 
accgacgtct atgcgggaga ctcccgctac 1560 
cggggcgacc gcgagatcct ggccgcgctg 162 0 
gacttcgccc gcgaactgct cgccttcacc 1680 
accccgctgg atctctccgg cttcaccgat 17^0 
ccgccggaca ccgcccccgg cgcctgacgc 1800 
cggcggccgc ccggagcccc gcccgcgctc 1860 
gctgcgagcc cggagcgggc cggccgacgg 1920 
gcggcgggcg tgaaaggccc tggcatcctc 1980 
ttccatccca gctcggcaag gatcgatccg 2040 
cgtgaaaggc gagatcacca aggtagtcgg 2100 
acgccgcttc gcggcgcggc ttaactcaag 2150 
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cgttagatgc actaagcaca taattgctca cagccaaact atcaggtcaa gtctgctttt 222 0 

attattttta agcgtgcata ataagcccta cacaaattgg gagatatatc atgaaaggct 22 80 

ggcr.tttt.ct tgttatcgca atagttggcg aagtaatcgc aacatccgca ttaaaatcta 2340 

gcgagggctt tactaagctg atccggtgga tgaccttctg aatgaccttt aatagattat 2400 

attactaatt aattggggac cctagaggtc ccctttttta ttttaaaaat tttttcacaa 2460 

aacggtttac aagcataaag cttgttaaca gatctcccgg ctcgtcggac actccggtac 2520 

ggccgtgact gaggaggtct accggaagca gatccggccc gtcatccaga ccggcgctgt 2580 

ggtcatggac ggcatcttca agcggggtcc ggcgcgatag tcacgcagat agacacgcac 2 640 

agaaaacagg tgaggcagac cgtaacgtta cggtctgcct cacctggtgt ttctctgtcg 2700 

gggtggcggg atttgaaccc acgacctctt cgtcccgaac "gaagcgcgcg atatc " 21 oS 



<21C> 92 
<21i> 2208 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle: Cassette 
excisable 

<40C> 92 

gatatcgcgc gcgcttcgtt cgggacgaag aggtcgnggg ttcaaatccc gccaccccga 6 0 

cagagaaaca ccaggtgagg cagaccgtaa cgttacggtc tgcctcacct gttttctgtg 12 0 

cgtgtctatc tgcgtgacta tcgcgccgga ccccgcttga agatgccgtc catgaccaca 180 

gcgccggtct ggatgacggg ccggatctgc ttccggtaga cctcctcagt cacggccgta 24 0 

ccggagtgtc cgacgagccg ggagatctgt taacaagctt tatgcttgta aaccgttttg 300 

tgaaaaaatt tttaaaataa aaaaggggac ctctagggtc cccaattaat tagtaatata 3 60 

atctattaaa ggtcattcaa aaggtcatcc accggatcaa ttcccctgct cgcgcaggct 420 

gggtgccaag ctctcgggta acatcaaggc ccgatccttg gagcccttgc cctcccgcac 480 

gatgatcgtg ccgtgatcga aatccagatc cttgacccgc agttgcaaac cctcactgat 540 

ccggctcacg gtaactgatg ccgtatttgc agtaccagcg tacggcccac agaatgatgt 6 00 

cacgctgaaa atgccggcct ttgaatgggt tcatgtgcag ctccatcagc aaaaggggat 660 

gataagttta tcaccaccga ctatttgcaa cagtgccgtt gatcgtgcta tgatcgactg 72 0 

atgtcatcag cggtggagtg caatgtcgtg caatacgaat ggcgaaaagc cgagctcatc 7 80 

ggtcagcttc tcaaccttgg ggttaccccc ggcggtgtgc tgctggtcca cagctccttc 840 

cgtagcgtcc ggcccctcga agatgggcca cttggactga tcgaggccct gcgtgctgcg 900 

ctgggtccgg gagggacgct cgtcatgccc tcgtggtcag gtctggacga cgagccgttc 96 0 

gatcctgcca cgtcgcccgt tacaccggac cttggagttg tctctgacac attctggcgc 1020 

ctgccaaatg taaagcgcag cgcccatcca tttgcctttg cggcagcggg gccacaggca 1080 

gagcagatca tctctgatcc attgcccctg ccacctcact cgcctgcaag cccggtcgcc 1140 

cgtgtccatg aactcgatgg gcaggtactt ctcctcggcg tgggacacga tgccaacacg 12 00 

acgctgcatc ttgccgagtt gatggcaaag gttccctatg gggtgccgag acactgcacc 1260 

attcttcagg atggcaagtt ggtacgcgtc gattatctcg agaatgacca ctgctgtgag 1320 

cgctttgcct tggcggacag gtggctcaag gagaagagcc ttcagaagga aggtccagtc 1380 

ggtcatgcct ttgctcggtt gatccgctcc cgcgacattg tggcgacagc cctgggtcaa 1440 

ctgggccgag atccgttgat cttcctgcat ccgccagagg gcgggatgcg aagaatgcga 1500 

tgccgctcgc cagtcgattg gctgagctca tgagcggaga acgagatgac gttggagggg 1560 

caaggtcgcg ctgattgctg gggcaacacg tgaaaggcga gatcaccaag gtagtcggca 162 0 

aataatgtcc aacaattcgt tcaagccgac gccgcttcgc ggcgcggctt aactcaagcg 1680 

ttagatgcac taagcacata attgctcaca gccaaactat caggtcaagt ctgcttttat 1740 

tatttttaag cgtgcataat aagccctaca caaattggga gatatatcat gaaaggctgg 18 00 

cttt ttcttg ttatcgcaat agttggcgaa gtaatcgcaa catccgcatt aaaatctagc 1860 

gagggcttta ctaagctgat ccggtggatg accttttgaa tgacctttaa tagattatat 192 0 

tactaattaa ttggggaccc tagaggtccc cttttttatt ttaaaaattt tttcacaaaa 1980 

cggtttacaa gcataaagct tctcgaggga tccctgtcag tcatgcgggc aacttagccg 2040 

agccctacga caccgcccgt gggaaggtga gtgtctaact gcgtgacaac gccagcgcac 2100 

agcggcggac aaccgcgacc acccatggac tggcgccgca ggtgagaagc acactggccc 2160 

aag-gtcgagc geccacccaa gttgcttcgg gacgaagagg cagatatc 2203 



1er depot 
138 



<210> 93 
<211> 60 
<212> ADN 

<213> Sequence artif icielle 

<220> . 
<223> Description de la sequence arcx^iciei_e : 
Oligonucleotide ORP2A 

cccgcgcggc agcctctccg tgatcgagtc cggcgtgacc atcgcgcgcg cttcgttcgg 60 



<21C> 94 
<211> 60 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artmcieile: 
Oligonucleotide ORF2B 

<400> 94 ^ 

gctccgtgcg tcatgcagga aggtgtcgta gtcgcggtag atctgcctct tc y ucccg a a. t>u 

<210> 95 

<211> 35 

<212> ADN 

<213> Sequence artif icielle 

<220> . 

<223> Description de la sequence artif icielle : Cicatrice 

att3 
<400> 95 

atcgcgcgcg cttcgttcgg gacgaagagg cagat JD 



<210> 96 
<21i> 59 
<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> Description de la sequence artir icielle : 
Oligonucleotide SDR 8 

<4 00> 96 

cgggatgatc gcttgtccgg cggccggatg cctagcctca tcgcgcgcgc ttcg 



<210> 97 
<211> 60 
<212> ADN 

< 2 1 3 > Sequence artif icielle 
<220> 

< 2 2 3 > Description de la sequence arti f icielle : 
Oligonucleotide SDR 9 
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<400> 97 

cccgatccag aacgtctggt cggtgatcag gtcgctgttc atctgcctct tcgtcccgaa 



<2I0> 98 
<211> 60 
<212> aDK 

<213> Sequence artificielie 
<22C> 

<223> Description de la sequence artif icieiie : 
Oligonucleotide EDR3 

<400> 98 

accggggcgg tcctcccctc cggggcgtca cggccgcgga atctgcctct tcgtcccgaa 



<210> 99 
<2I1> 60 
<212> ADN 

<213> Sequence artificielie 
<22C> 

< 2 2 3 > Description de la sequence artificielie: 
Oligonucleotide EOR4 

<400> 99 

cacgcagcga gccgacgcac tgatggacga cacgatggcc atcgcgcgcg cttcgttcgg 



<210> 100 
<211> 60 
<212> ADN 

<213> Sequence artificielie 
<220> 

<223> Description de la sequence artificielie: 
Oligonucleotide SDR 5 

<400> 100 

gggcgtgaag cgggcgagtg tggatgtcat gcgagtactc atcgcgcgcg cttcgttcgg 



<210> 101 
<21i> 60 
<212> ADN 

<213> Seq-aence arcificieile 
<220> 

<223> Description de la sequence artificielie: 
Oligonucleotide EDR6 

<400> 101 

cgggaaacgg cgtcgcactc ctcgggggcc gcgtcagccc atctgcctct tcgtcccgaa 



<210> 1C2 
<21i> 26 



1 er depot 

140 



<22C> 

< 2 2 3 > Description de la sequence aruif icielle : 
Oligonucleotide CS583 

<400> 102 

ctgcaggtgc tccagcgcgt cgatct 



<210> 103 
<211> 26 
<212> ADN 

<213> Sequence artif iciell e 
<220> 

<223> Description de la sequence artif icielle : 
Oligonucleotide C9584 

<400> 103 

ctgcagacgg aggcggacct gcgget 



<210> 104 
<2il> 33 
<212> ADN 

<2 13> Sequence artif icielle 
<220> 

<223> Description de la sequence artif icielle : Cicatrice 
attl 

<400> 104 

atcgcgcgct tcgttcggga cgaagaggta gat 2 3 



<210> 105 
<211> 34 
<212> ADN 

<213> Sequence art if icielle 
<220> 

<223> Description de la sequence artif icielle : Cicatrice 
att2 



<400> 105 

atcggcgcgc ttcgttcggg acgaagaggt agat v 



34 
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3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QU'INVENTEUR(S) : 



Q Norn 


GERBAUD 




Prenoms 


Claude 


Adresse 


Rue 


3 allee Dunand 




Code postal et ville 


|9 |3|2|2|0| GAG NY 


Societe d'appartenance tfacuitatifj 




Q Norn 


GONDRAN 




Prenoms 


Anne 


Adresse 


Rue 


27 rue de I'lnteme Loeb 




Code postal et vitle 


|7 [5 »0 i1 i3| PARIS 


j Societe d'appartenance (facullatifj 




H Norn 


KARRAY 


Prenoms 


Fatma 


Adresse 


Rue 


Residence Universitaire les Rives de TYvette, 
Batirnent 233, ch 2008 




Code postal et ville 


|9 1 1 i4 ,4 i0 I BURES SUR YVETTE 


Societe d'appartenance ffhcuUat'if) 





S'il y a plus de trois inventeurs, utilisez plusieurs formulaires. Indiquez en haut a droite le N° de (a page suivi du nombre de pages. 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 




BOUVET Philippe 



La lot n°78-17 du 6 janvier 1978 relative a I'informatique, aux fichiers et aux liberies s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de PINPI. 



regue le 07/03/03 



IISPI 



■ IH3TITUT 
NATIONAL DE 
U PROPRIETC 
INDUSTRIEILE 



DEPARTEMENT DES BREVETS 

26 bis, rue de Saint Petersbourg 
75800 Paris Cedex 08 

Telephone : 33 {1} 53 04 53 04 TSIecopie : 33 (1) 42 94 86 54 



BREVET D'INVENTION 
CERTIFICAT D'UTILITE 

Code de la propriete intellectuelle - Livre VI 

DESIGNATION DMNVENTEUR(S) Page N° 3. ./4. 

(A fournir dans le cas ou les demandeurs et 

les inventeurs ne sont pas les memes personnes) 



N° 11235*03 



Cet imprime est a remplir lisiblement a I'encre noire 



08 113 @ W / 270601 



Vos references pour ce dossier (facultatif) 


FRAV2002/0028 


N° D'ENREGISTRE MENT NATIONAL 


02 12489- 









TITRE DE L f INVENTION (200 caracteres ou espaces maximum) 
POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES NUCLEOTIDIQUES 
CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS. 



LE(S) DEMANDEUR(S) : 

AVENTIS PHARMA S.A. : 

20 avenue Raymond Aron - 92160 ANTONY (France) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) : 
3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QUMNVENTEUR(S) : 



H Nom 


LACROIX 


Prenoms 


Patricia 


Adresse 


Rue 


28 allee de Bellevue 


Code postal et ville 


|9i4i1 |7|0| LE PERREUX 


Societe d'appartenance (facultatif) 




Q Nom 


OESTREICHER-MERMET-BOUVIER 


Prenoms 


Nathalie 


Adresse 


Rue 


9 rue Louise Filliaux-Tiger 


Code postal et ville 


|9i2i1 i4i0l CLAMART 


Societe d'appartenance (facultatif) 




O Nom 


PERNODET 


Prenoms 


Jean-Luc 


Adresse 


Rue 


21 rue des Jardins 


Code postal et ville 


[9 ,4|2;3i0|CACHAN 


Societe d'appartenance (facultatif) 





S'il y a plus de trois inventeurs, utilisez plusieurs formulaires. Indiquez en haut a droite le N° de la page suivi du nombre de pages. 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 
(Nom et qualite du signataire) 




BOUVET Philippe 

La loi n°787l7 du 6 janvier 1978 relative a l 7 informatique r aux fichiers et aux libertes s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour les donnees vous concernant aupres de I'lNPI. 



regue le 07/03/03 



IN 5 ! 



BREVET D" INVENTION 

CERTIFICAT D'UTILITE 



N° 11235^03 



miIomlvi Code de ,a P ro P r »ete intellectuelle - Livre VI 



NATIONAL DC 
LA. fROPBUlf 
IHDU3TBIEILC 



INV 



DEPARTEMENT PES BREVETS DESIGNATION D'INVENTEUR(S) Page N° 4 . . / 4 

26 bis. rue de Saint Petersbourg (A fournir dans le cas oil ies demandeurs et 

75800 Paris Cedex 08 ies inventeurs ne sont pas Ies memes personnes) 

Telephone : 33 (1) 53 04 53 04 Te.ecopie : 33 (1) 42 94 86 54 ^ .^.^ ^ . rempl|r tisib , e ment 3 Tencre noire ■»,».*/ *7o«» 



Vos references pour ce dossier (fa en tint if) 


FRAV2002/0028 


N° D'ENREGISTREMENT NATIONAL 


02 12489 



TITRE DE L'INVENTION (200 caracteres ou espaces maximum) 

POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES NUCLEOTIDIQUES 
CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS. 



LE(S) DEMANDEUR(S) : 

AVENTIS PHARMA S.A. : 

20 avenue Raymond Aron - 92160 ANTONY (France) 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) : 
3 rue Michel Ange - 75794 PARIS CEDEX 16 (France) 



DESIGNE(NT) EN TANT QU'INVENTEUR(S) : 



Q Nom 


TUPHILE 


Prenoms 


Karine 


Adresse 


Rue 1 


1 8A rue de I'Oratoire 


Code postal et ville 


|6 1 9 i 3 1 0 |0 | CALUIRE ET CUIRE 


Societe d'app 


arte nance (faarftatif) 




Q Nom 




Prenoms 




Adresse 


Rue 




Code postal et ville 


I i i I I I 


Societe d'app 


arte nance (faaiUatif) 




H Nom 




Prenoms 




Adresse 


Rue 




Code postal et ville 


I i i i i I 


Societe d'app 


>artenance (faailtqtif) 





S'il y a plus de trois inventeurs, utilisez plusieurs formulaires. Indiquez en haut a drotte le N° de la page suivi du nombre de pages. 



DATE ET SIGNATURE(S) 
DU (DES) DEMANDEUR(S) 
OU DU MANDATAIRE 




La loi n°78-17 du 6 janvier 1978 relative a I'informatique, aux fichiers et aux liberies s'applique aux reponses faites a ce formulaire. 
Elle garantit un droit d'acces et de rectification pour Ies donnees vous concernant aupres de I'lNPI. 



